首页 理论教育 不完全多重共线性的影响与应对措施

不完全多重共线性的影响与应对措施

时间:2023-05-25 理论教育 版权反馈
【摘要】:完全多重共线性的情形只不过是一种极端。通常,解释变量之间并不一定是完全的线性关系。如果模型中存在不完全的多重共线性,这种情况下(X′X)-1也存在,可以得到参数的估计值,但是对计量经济分析可能会产生一系列的影响。如果=0,则VIFi=1,此时不存在多重共线性。出现这种情况,很可能正是存在严重多重共线性的表现。

不完全多重共线性的影响与应对措施

完全多重共线性的情形只不过是一种极端。通常,解释变量之间并不一定是完全的线性关系。如果模型中存在不完全的多重共线性,这种情况下(X′X)-1也存在,可以得到参数的估计值,但是对计量经济分析可能会产生一系列的影响。

1.增大最小二乘估计量的方差

由于,所以参数估计值仍然可以算出,并且仍然满足线性、无偏性和最小方差性。但是由于协方差矩阵

中的对角线元素的数值将很大。即各共线变量的参数的OLS的估计值方差很大,即估计值的精度很低。

可以证明,参数估计值 的方差为

其中,表示第i个解释变量对模型中其他解释变量作辅助回归模型xi=f(x1,x2,…xi-1,xi+1,…xk)时的决定系数,当只有两个解释变量x1、x2 时,则就是变量x1、x2相关系数的平方,即。式(6.2.2)中第二项因子1/(1-)称为方差膨胀因子(Variance Inflating Factor),记成

则有

当xi与模型中其他解释变量存在严重多重共线性时,即→1,VIFi→∞,接近于1,共线性程度越强。如果=0,则VIFi=1,此时不存在多重共线性。

2.参数估计量经济含义不合理

3.变量的显著性检验和模型的预测功能失去意义

在多元线性回归模型中,参数显著性检验的t统计量为

由于 的方差很大,其标准差亦随之增大,t统计量偏小,这样容易淘汰一些不应淘汰的解释变量,使统计检验的结果失去可靠性

由于中的对角线元素的数值很大,从而置信区间很大,使区间估计用于判断参数估计值的可靠性失去意义。变大的方差容易使预测的“区间”变大,从而降低预测精度,使预测失去意义。

4.回归模型缺乏稳定性(www.xing528.com)

当多重共线性严重时,可能造成可决系数R2较高,经F检验的参数联合显著性也很高,但对各个参数单独的t检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。出现这种情况,很可能正是存在严重多重共线性的表现。

案例:近年来,中国旅游业一直保持高速发展,旅游业作为国民经济新的增长点,在整个社会经济发展中的作用日益显现。中国的旅游业分为国内旅游和入境旅游两大市场,入境旅游外汇收入年均增长22.6%,与此同时国内旅游也迅速增长。改革开放20多年来,特别是进入20世纪90年代后,中国的国内旅游收入年均增长14.4%,远高于同期GDP 9.76%的增长率。为了规划中国未来旅游产业的发展,需要定量地分析影响中国旅游市场发展的主要因素。

经分析,影响国内旅游市场收入的主要因素,除了国内旅游人数和旅游支出以外,还可能与相关基础设施有关。为此,考虑的影响因素主要有国内旅游人数X2,城镇居民人均旅游支出X3,农村居民人均旅游支出X4,并以公路里程X5铁路里程X6作为相关基础设施的代表。为此设定了如下对数形式的计量经济模型:

其中,Yt——第t年全国旅游收入

X2——国内旅游人数(万人)

X3——城镇居民人均旅游支出(元)

X4——农村居民人均旅游支出(元)

X5——公路里程(万公里)

X6——铁路里程(万公里)

为估计模型参数,收集旅游事业发展最快的1994—2003年的统计数据,如表4-1所示:

表4-1 1994—2003年中国旅游收入及相关数据

数据来源:《中国统计年鉴2004》

利用Eviews软件,输入Y、X2、X3、X4、X5、X6等数据,采用这些数据对模型进行OLS回归,结果如表4-2所示。

表4-2 多元回归估计结果

由此可见,该模型R2=0.9954,R2=0.9897可决系数很高,F检验值173.3525,明显显著。但是当α=0.05时tα/2(n-k)=t0.025(10-6)=2.776,不仅X2、X6系数的t检验不显著,而且X6系数的符号与预期的相反,这表明很可能存在严重的多重共线性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈