首页 理论教育 多元统计分析的实例分析及SAS实现

多元统计分析的实例分析及SAS实现

时间:2023-10-30 理论教育 版权反馈
【摘要】:我们将通过以下例子来演示累积Logistic模型的SAS实现,所用数据来自于2014年全国流动人口卫生计生动态监测数据,我们简单探究流动人口城市归属感的影响因素。图4-12显示卡方值为48.8555,自由度为22,p值小于0.05,这说明成比例假设可能不是对所有Logit都成立,运用累积Logistic回归模型有一定的风险。

多元统计分析的实例分析及SAS实现

我们将通过以下例子来演示累积Logistic模型的SAS实现,所用数据来自于2014年全国流动人口卫生计生动态监测数据,我们简单探究流动人口城市归属感的影响因素。本节将数据集命名为exe4_2,相关变量如下:

因变量

belongcity:对本地城市的归属感(1=非常弱,2=弱,3=一般强烈,4=非常强烈)

自变量

gen:性别(1=男,0=女)

marriage:婚姻状况(1=在婚,0=不在婚)

edu:受教育程度(1=小学及以下,2=初中,3=高中及以上)

income:家庭月收入(1=2000元以下,2=2000~4000元,3=4000~6000元,4=6000~8000元,5=8000~10000元,6=10000元以上)

range:流动范围(1=跨省,2=省内跨市,3=市内跨县,4=跨境)

SAS程序:

proc logistic data=exe4-2 descending;

class gen edu income range marriage;

model belongcity=gen edu income marriage range

/scale=none aggregate rl;

run;

其中,scale=none aggregate rl命令使得回归过程计算偏差(Deviance)和Pearson卡方拟和优度统计量,其中scale=none表示对过离散的情况不作调整。

SAS结果:

SAS部分结果输出如下:

(www.xing528.com)

图4-10 有序多分类因变量的Logistic回归模型样本规模

图4-11 有序多分类因变量的Logistic回归模型的基本情况

图4-12 有序多分类因变量的Logistic回归模型成比例假设检验结果

图4-13 有序多分类因变量的Logistic回归模型Pearson χ2值和D统计量

图4-14 有序多分类因变量的Logistic回归模型模型拟合结果

图4-15 有序多分类因变量的Logistic回归模型假设检验结果

图4-16 有序多分类因变量的Logistic回归模型最大似然估计结果

图4-17 有序多分类因变量的Logistic回归模型OR值估计结果

SAS结果解释:

在本例中,累积Logistic回归模型将对当地的归属感按由高到低的顺序排列,重新排序后的对数发生比(Logit)为:非常强烈的归属感对一般强烈,弱、非常弱的归属感的对数发生比;非常强烈或一般强烈的归属感对弱和非常弱的归属感的对数发生比;非常强烈、一般强烈和弱的归属感对非常弱的归属感的对数发生比。图4-12显示卡方值为48.8555,自由度为22,p值小于0.05,这说明成比例假设(也称为平行假设)可能不是对所有Logit都成立,运用累积Logistic回归模型有一定的风险。图4-13显示模型的拟合情况均较好,Deviance和Pearson卡方值都是显著有意义的,也通过了回归系数检验。在累积回归中,SAS提供的拟合优度指标和预测指标的解读与二分类因变量Logistic回归中类似,对系数的解释也基本与二分类因变量Logistic回归相同。比如,图4-16中,变量Marriage的回归系数为-0.1142,p值小于0.05,有统计性差异,这表明对于所有的累积Logit而言(即非常强烈的归属感对一般强烈,弱、非常弱的归属感的对数发生比;非常强烈或一般强烈的归属感对弱和非常弱的归属感的对数发生比;非常强烈、一般强烈和弱的归属感对非常弱的归属感的对数发生比),在其他变量不变的情况下,未婚状态中的流动者对本地城市感到有归属感的发生比是其他人的0.796倍(e-0.1142≈0.796),因此婚姻状态对于本地城市的归属感来说是一个限制性因素。总的来说,累积Logistic回归模型对于变量分类的次序非常敏感,当我们运行累积Logistic回归模型时,应当按照研究所需保证因变量的类别排序正确。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈