首页 理论教育 显著性检验的优化方法

显著性检验的优化方法

时间:2023-07-03 理论教育 版权反馈
【摘要】:表8.5Excel输出的方差分析表在表8.5中,除了输出检验统计量F值外,还给出了用于检验的显著性F,即Significance F,它相当于用于检验的p值。2)回归系数的检验回归系数的显著性检验是检验自变量对因变量的影响是否显著。根据例8.1及表8.4提供的数据,对贷款余额是否是影响不良贷款的一个显著性因素进行检验。在进行显著性检验时,有以下两点需要注意

显著性检验的优化方法

回归分析的主要目的是根据所建立的估计方程用自变量x来估计或预测因变量y。由于估计方程是由随机样本数据得出的,它是否真实地反映了变量x和y之间的关系,只有通过检验后才能证实,才能由自变量x来估计和预测因变量y。

利用样本数据拟合回归方程时,假定变量x和y之间存在线性关系,即y=β0+β1x+ε,并假定误差项ε是一个服从正态分布随机变量,且对不同的x具有相同的方差。但这些假设是否成立,必须通过检验后才能证实。

回归分析中的显著性检验主要包括两个方面的内容:一是线性关系的检验;二是回归系数的检验。

1)线性关系的检验

线性关系的检验是检验自变量x和因变量y察察为明的线性关系是否显著。或者说,它们之间是否可用一个线性模型y=β0+β1x+ε表示。为检验两个变量之间的线性关系是否显著,则需要构造用于检验的一个统计量。该统计量的构造是以回归平方和(SSR)以及残差平方和(SSE)为基础的。将SSR除以其相应的自由度(自变量的个数k,一元线性回归中自由度为1)后的结果称为均方回归,记为MSR;将SSE除以相应的自由度(n-k-1,一元线性回归中自由度为n-2)后的结果称为均方残差,记为MSE,如果原假设成立(H0:β1=0两个变量之间的线性关系不显著),则比值MSR/MSER的抽样分布服从分子自由度为1,分母自由度为n-2的F分布,即

故当原假设H0:β1=0时成立时,MSR/MSE的值应接近1,但如果原假设H0:β1=0不成立,MSR/MSE的值将变得无穷大。因此,较大的MSR/MSE值将导致拒绝原假设H0,此时,就可以断定变量x和y之间存在着显著的线性关系。

注意

当不拒绝原假设时,只能表明样本数据提供的信息,只能证实两个变量之间不存在线性关系,而不是表明两个变量没有任何关系。

线性关系检验的具体步骤如下:

第1步:提出假设H0∶β1=0两个变量之间的线性关系不显著。

第2步:计算检验统计量F为

第3步:作出决策。确定显著性水平α,并根据分子自由度df1=1和分母自由度df1=n-2查F分布表,得到相应的临界值Fα。若F>Fα,则拒绝H0,表明两变量之间线性关系是显著的;若F<Fα,则不拒绝H0,没有证据表明两变量之间线性关系显著。

【例8.7】 根据例8.1数据和表4Excel输出结果,检验不良贷款和贷款余额之间的线性关系的显著性(α=0.05)。

解 第1步:提出假设H0∶β1=0两个变量之间的线性关系不显著。

第2步:计算检验统计量为

第3步:作出决策。根据显著性水平α=0.05,分子自由度df1=1和分母自由度df1=n-2查F分布表,得到临界值Fα=4.28。由于F>Fα,则拒绝H0,表明不良贷款和贷款余额之间线性关系是显著的。

表8.5为Excel输出的方差分析表。

表8.5 Excel输出的方差分析表

在表8.5中,除了输出检验统计量F值外,还给出了用于检验的显著性F,即Significance F,它相当于用于检验的p值。除了可用统计量进行决策外,利用Significance F,直接与给定的显著性水平α的值进行对比,如果Significance F的值小于α值,则拒绝原假设H0,表明因变量y与自变量x之间有显著的线性关系;如果Significance F的值大于α值,则不拒绝原假设H0,表明因变量y与自变量x之间没有显著的线性关系。

在表8.5中输出的结果,Significance F=1.18349E-0.7<α=0.05,这说明不良贷款与贷款余额之间存在显著的线性关系。

2)回归系数的检验

回归系数的显著性检验是检验自变量对因变量的影响是否显著。在一元线性回归模型y=β0+β1x+ε中,如果回归系数β1=0,回归线是一条水平线,表明因变量y的取值不依赖于自变量x,即两个变量之间没有线性关系。如果回归系数β1≠0,也不能肯定就得出两个变量之间存在线性关系的结论,要看这种关系是否具有统计意义上的显著性。为此,需要研究回归系数β1的抽样分布。

其中,σ是误差项ε的标准差。

这样,就可构造出用于检验回归系数β1的统计量t为

该统计量服从自由度为n-2的t分布。如果原假设成立,则β1=0,检验的统计量为

回归系数显著性检验的步骤如下:

第1步:提出假设为(www.xing528.com)

H0∶β1=0;H1∶β1≠0

第3步:作出决策。确定显著性水平α,并根据自由度df1=n-2查t分布表,得到相应的的,两者之间尚不存在显著的线性关系。

【例8.8】 根据例8.1及表8.4提供的数据,对贷款余额是否是影响不良贷款的一个显著性因素进行检验。

解 第1步:提出假设为

H0:β1=0;H1:β1≠0

第2步:计算检验统计量为

第3步:作出决策。根据给定显著性水平α,自由度df1=n-2=25-2=23,查t分布表,得临界值tα/2=t0.025=2.0687。由于t=7.533797>t0.025=2.0687,所以拒绝H0,表明贷款余额是影响不良贷款的一个显著性因素。

在实际应用中,可直接用Excel输出的参数估计表进行检验。表8.4中除了给出检验统计量外,还给出了用于检验的p值(p⁃value)。检验时可直接将p⁃value与给定的α进行比较,若p⁃value<α,则拒绝原假设H0,若p⁃value>α,则不拒绝原假设H0。在本例中,p⁃value=0.000000<α=0.05,所以拒绝原假设,与前面的结论是一致的。

在进行显著性检验时,有以下两点需要注意:

①对回归系数进行检验时,如果拒绝了,H0∶β1=0仅仅表明在样本观测值范围之内,x和y之间存在线性关系,而且一个线性关系只是解释了y的变差中的显著部分。

②在一元线性回归中,自变量只有一个,因此F检验和t检验是等价的。但在多元回归分析中,这两种检验的意义是不同的,F检验是用来检验总体回归关系的显著性,而t检验则是检验各个回归系数的显著性。

为使读者能够完全明了Excel输出结果,最后将给出前面未涉及的一些结果的计算公式,见表8.6。对这些结果的解释可进一步参考其他有关书籍

表8.6 Excel输出的部分结果的计算公式

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈