首页 理论教育 拟合优度的度量方法探析

拟合优度的度量方法探析

时间:2023-05-25 理论教育 版权反馈
【摘要】:样本回归函数对样本点的解释能力从图形上来看,就直观表现为样本回归线对样本点拟合的优劣程度,因此,称为样本回归线的拟合优度。(二)可决系数在样本容量给定的情况下,可以表征样本点中被解释变量观测值Y1…(三)可决系数与简单线性相关系数的关系首先对可决系数R2的表达式进行变形。

拟合优度的度量方法探析

由前文所述可知,无论是普通最小二乘法还是极大似然法,都试图通过某种准则似的参数估计值“尽可能接近总体参数”,但由于总体参数往往是未知的,各种准则最终都是通过尽可能多的解释样本点信息以实现参数估计的基本原则,因此,样本回归函数对样本点的解释能力就成为判断总体回归函数估计效果的重要指标。样本回归函数对样本点的解释能力从图形上来看,就直观表现为样本回归线对样本点拟合的优劣程度,因此,称为样本回归线的拟合优度。

(一)总变差的分解

由式(2-12)可知,那么Yi与被解释变量样本均值Y的偏离程度,可以表示为

式(2-59)所描述的关系可以通过图2-12进行直观表征。

图2-12 总变差分解图

对式(2-59)两边进行平方并求和可得

其中,

由∑ei=0和∑ei Xi=0,可知:,因此

为总离差平方和(TSS),为回归解释的平方和(ESS),∑ei2残差平方和(RSS)。(www.xing528.com)

(二)可决系数

样本容量给定的情况下,可以表征样本点中被解释变量观测值Y1…Yn的变异程度;由于被解释变量观测值的均值与被解释变量条件均值的预测值的均值是相等的,因此,衡量了的变异程度;而的变异可以通过样本回归线被解释变量的变异全部解释,由前文关于残差项的分析可知,残差项恰好是被解释变量观测值中不能通过样本回归线由解释变量解释的部分。因此,式(2-60)意味着被解释变量的变异可以分解为两部分:其一是可以通过样本回归线由解释变量变化解释的部分;其二是不能通过样本回归线由解释变量变化解释的部分。这就意味着回归解释的平方和占总离差平方和的比重越大,样本回归线对样本点的解释能力越强,这一比例称为可决系数(R2)。

由式(2-60)式可知,,因此,

表2-5中的R-squared项即为可决系数R2,其取值为0.978539,这就意味着通过样本回归函数(58)中国2015年31个省市自治区人均消费支出的变异有97.8539%可以被人均可支配收入的变异所解释。

(三)可决系数与简单线性相关系数的关系

首先对可决系数R2的表达式进行变形。

由式(2-2)可知

因此:

虽然R2和γXY存在上述的数量关系,但二者还是存在较大差异,首先从内涵上来讲,R2是从样本回归函数对样本点的解释能力角度出发,评价样本回归函数优劣的一个指标,而γXY是用来衡量解释变量和被解释变量间的线性统计依存关系;其次,在衡量两个变量间的线性依存关系时,两个变量都是随机变量,地位对称,不考虑因果关系,而可决系数主要衡量了被解释变量变化可以通过样本回归线由解释变量变化解释的能力,两变量间存在因果关系,且一般假设解释变量为非随机变量;另外从取值范围来看,-1≤γXY≤1,而0≤R2≤1。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈