首页 理论教育 多元线性回归简介-多元统计分析与SAS实现

多元线性回归简介-多元统计分析与SAS实现

时间:2023-10-30 理论教育 版权反馈
【摘要】:多元线性回归模型可以使用多个变量或者多个特征来预测因变量。由于在做多元回归预测时需要分析的数据往往是多变量的,自变量不再是一组数据,而是由多组数据作为自变量。应用多元线性回归进行统计分析时要求满足哪些条件呢?多元回归模型基于以下假设,需满足的条件总结起来包括:线性关系、相互独立、正态分布、方差齐性。满足以上条件后,含有一个因变量和两个以上(含两个)解释变量的线性回归模型,我们称为多元线性回归模型。

多元线性回归简介-多元统计分析与SAS实现

在实际研究中,研究者们经常会探究多个因素共同对变量的影响。例如,要研究居民健康水平的决定因素,除了考虑居民饮食的影响之外,还应考虑医疗保险、健康运动、生活环境等多种因素的共同影响。此时,我们需要将简单的一元回归模型推广到包含多个解释变量的多元回归模型,以满足研究的需要,并更为合理地解释现实。因此,我们有必要扩展线性回归模型,使其能容纳更多的解释变量。多元线性回归模型(multiple linear regression model)可以使用多个变量或者多个特征来预测因变量。

由于在做多元回归预测时需要分析的数据往往是多变量的,自变量不再是一组数据,而是由多组数据作为自变量。那么我们在做多元回归分析时就需要特别注意了解我们的数据是否能够满足做多元线性回归分析的前提条件。应用多元线性回归进行统计分析时要求满足哪些条件呢?多元回归模型基于以下假设,需满足的条件总结起来包括:线性关系、相互独立正态分布方差齐性。

(1)因变量是连续变量,自变量是连续变量或分类变量。

(2)自变量与因变量之间存在线性关系,这可以通过绘制散点图进行考察因变量随各自变量的变化情况。如果因变量与某个自变量之间呈现出曲线趋势,可尝试通过变量变换予以修正,常用的变量变换方法有对数变换、倒数变换、平方根变换、平方根反正弦变换等。

(3)各观测间相互独立,残差之间不存在自相关,任意两个观测残差的协方差为0,也就是要求自变量间不存在多重共线性问题。其实,观测值是否相互独立与研究设计有关。如果研究者确信观测值不会相互影响,我们甚至可以不做检验,直接认定研究满足残差之间不存在自相关。(www.xing528.com)

(4)残差服从正态分布,不同组的残差均服从同一个均数为0,标准差为σ2的正态分布。

(5)残差的大小不随所有变量取值水平的改变而改变,即方差齐性。如果方差齐,不同预测值对应的残差应大致相同,即散点图中各点均匀分布,不会出现特殊的分布形状。如果残差点分布不均匀,散点图形成漏斗或者扇形,表明方差不齐。当然,如果不满足方差齐性假设,我们也可以通过一些统计手段进行矫正。比如,采用加权最小二乘法回归方程,改用更加稳健的分析方法以及转换数据等。

(6)因变量没有异常值,在线性回归中,异常值是指观测值与预测值相差较大的数据。这些数据不仅影响回归统计,还对残差的变异度和预测值的准确性有负面作用,并阻碍模型的最佳拟合。因此,我们必须重视异常值。

满足以上条件后,含有一个因变量和两个以上(含两个)解释变量的线性回归模型,我们称为多元线性回归模型(Neter J,1996)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈