首页 理论教育 Logistic模型的定义及性质

Logistic模型的定义及性质

时间:2023-11-17 理论教育 版权反馈
【摘要】:Logistic回归是一种非线性回归分析模型,可用于估计某个事件发生的可能性,也可分析某个问题的影响因素。Logistic回归与线性回归最大的区别在于,因变量Y的数据类型。把这个规律抽象为数学式并把这条曲线命名为Logistic曲线。两边取对数,得此时Logistic 模型与多元线性回归模型是一致的,这也是Logistic概率函数的一个常用表达式之一,可以利用它预测某事件发生的概率。因为Logistic函数的这一性质保证了由 Logistic 模型估计的值在区间,符合概率的定义。

Logistic模型的定义及性质

Logistic回归是一种非线性回归分析模型,可用于估计某个事件发生的可能性,也可分析某个问题的影响因素。Logistic回归与线性回归最大的区别在于,因变量Y的数据类型。线性回归分析的因变量Y属于定量数据,而Logistic回归分析的因变量Y属于分类数据(按照现象的某种属性对其进行分类或分组而得到的反映事物类型的数据,又称定类数据。例如,按照性别将人口分为男、女两类)。

Logistic回归再进一步细分,又可分为二元Logistic回归、多分类Logistic回归、有序Logistic回归等。如果Y值仅两个选项,分别是有和无之类的分类数据,选择二元Logistic回归分析,它是使用频率最高的。Y值的选项有多个,并且选项之间没有大小对比关系,则可以使用多元Logistic回归分析。Y值的选项有多个,并且选项之间可以对比大小关系,选项具有对比意义,应该使用多元有序Logistic回归分析。

Logistic曲线(逻辑曲线)是由比利时数学家Verhulst在人口增长规律的研究中得来的。他发现,社会人口的增长速度最初随着时间的增加而逐渐加快,在经过一段时间的高速增长之后,人口增长速度逐渐减慢,最后社会人口总量趋于稳定。美国生物学家和人口统计学家Pearl,通过对生物繁殖和生长过程的大量研究以及对各国人口的增长情况的分析,发现了相同的规律,提出一个模拟生长过程的数学模型。把这个规律抽象为数学式

并把这条曲线命名为Logistic曲线。该曲线如图6.4.1所示。

图6.4.1 Logistic曲线

1920年Robert B. Pearl和Lowell J. Reed 重新发现这个函数,开始在人口估计和预测中推广应用,并引起广泛注意。

Logistic概率函数的一般形式为

Logistic函数的性质有:(www.xing528.com)

性质1 Logistic 模型的非线性函数通过变换可以转化为线性函数。

两边取对数,得

此时Logistic 模型与多元线性回归模型是一致的,这也是Logistic概率函数的一个常用表达式之一,可以利用它预测某事件发生的概率。

lnΩ称为Logit p,变换后Logit p与Ω仍成增长(或下降)的一致性关系,且取值在整个实数范围内,与一般线性回归模型中因变量的取值范围相吻合。

性质2 对Logistic函数来说,pi是zi的连续增函数,且pi∈(0,1)。

因为

Logistic函数的这一性质保证了由 Logistic 模型估计的值在(0, 1)区间,符合概率的定义。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈