首页 理论教育 多元统计分析与SAS实现:零膨胀模型概述

多元统计分析与SAS实现:零膨胀模型概述

时间:2023-10-30 理论教育 版权反馈
【摘要】:近年来,计数资料的零膨胀现象在各个领域中受到了广泛的关注,国内外众多学者在不同应用背景下提出了许多处理零膨胀数据的模型。一般而言,处理零膨胀现象的模型包括Hurdle模型、零膨胀Poisson模型及零膨胀负二项模型等。由于Hurdle模型在经济学中的特殊性与争议,本书只对零膨胀Poisson模型和零膨胀负二项模型进行相应的介绍。

多元统计分析与SAS实现:零膨胀模型概述

在计数资料的实际研究中,观察事件发生数中经常会出现含有大量零值的现象,即许多观察个体在观察单位时间、单位面积或者单位容积内没有发生相应的随机事件。如一年内的住院次数、一定时间内的犯罪次数、一定时期内妇女的生育孩子数或流产次数等。这些计数数据中的零值要明显比泊松分布、负二项分布等离散分布产生的零值多,这样一种特殊的数据已超出了Poisson回归和负二项回归等一般计数模型的预测范围,因为零发生概率常常会被低估,导致模型参数估计的结果与实际情况存在较大偏差。由于计数资料中零值过多且取相同的零值反映了不同的情况,常常会导致计数资料表现出较大的变异,这类现象被称为计数资料的零膨胀(zero-inflated),我们也称这类数据为零膨胀数据。

近年来,计数资料的零膨胀现象在各个领域中受到了广泛的关注,国内外众多学者在不同应用背景下提出了许多处理零膨胀数据的模型。1986年,Mullahy提出了Hurdle模型用来处理零膨胀数据(Mullahy,1986),该模型是将零数据看作一个整体与非零数据截然分开,即零数据出现只有一个过程,非零数据是由不同的过程决定:第一个过程决定零事件发生还是非零事件发生的可能,发生取1不发生取0,这个过程服从(0,1)分布,当第一个过程取1则进入第二个过程,即事件发生了多少次的过程,这个过程事件至少发生1次。后来,Lambert在1992年提出了另外一种解决零膨胀现象的零膨胀Poisson模型(Zero-inflated Poisson,ZIP)(Lambert,1992),与Hurdle模型的基本思想不同的是,ZIP模型将整个计数数据分为两个过程:零计数过程和泊松计数过程。由此可知零数据的出现有两个过程,凭借这种机制,我们便可以针对这两个过程建立混合概率分布。1994年,Greene将零膨胀Poisson模型扩展到零膨胀负二项模型(zero-inflated negative binomial,ZINB)(Greene,1994),该模型是Poisson模型与负二项模型的发展,弥补了Poisson模型或负二项模型在分析零膨胀数据时存在的不足,能解释计数资料中过多的零值,使因变量中真实零值的识别成为可能,同时也使估计结果更为有效和无偏。(www.xing528.com)

一般而言,处理零膨胀现象的模型包括Hurdle模型、零膨胀Poisson模型及零膨胀负二项模型等。由于Hurdle模型在经济学中的特殊性与争议(Dalrymple et al.,2003),本书只对零膨胀Poisson模型和零膨胀负二项模型进行相应的介绍。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈