首页 理论教育 河川径流信息解读:AIC准则法

河川径流信息解读:AIC准则法

时间:2023-10-20 理论教育 版权反馈
【摘要】:Akaike的AIC 是基于观测数据选择最优参数模型的信息准则。AIC准则要求参数由最大似然法估计,但当序列不服从正态分布时,计算表明该准则也适用于最小二乘法估计。AIC准则是模型优化的一种宏观度量,但不宜机械地以绝对最小值来选择模型阶数,而是要在所对应的模型进行多方比较后,确定合理的模型阶数以及相应参数。

河川径流信息解读:AIC准则法

Akaike的AIC (Akaike 1973年,1974年)是基于观测数据选择最优参数模型的信息准则。它已被认为是20世纪统计学的重要发现之一。1973年日本学者赤池针对ARMA(p,q)模型中的阶数p和q,提出了最小AIC准则(Akaike Information Criterion)。这个准则从提取出观测数据序列中的最大信息量出发,适用于AR、MA和ARMA模型的检验。

假定用一个概率密度函数f去逼近未知密度g。称下式为库尔贝克—雷伯尔(Kullback-Leibler)信息量

提供了对逼近优劣的一个度量。易见

由Jansen不等式,我们有

等式成立当且仅当f=g。一个好的逼近应该使得度量I(g;f)尽可能地小。注意,式 (5-38)右边的第一项不依赖于f。因此,我们应该选择f,使得

极小化。由于我们不知道g,而仅有来自g的观测集合{X1,X2,…,XN}。自然地,用无偏估计来代替上面的期望

通常我们要在由m标示的参数族{fm(·|θm)}的集合中选择f,对每一个m,fm的形式一般是给定的。例如,在时间序列分析中,fm可以是一个具有阶m ≡(p,q)的ARMA族,θm=(b1,b2,…,bp;a1,a2,…,aq),其最优逼近将极小化

Akaike证明了偏差能够渐近地近似为

对上式乘上因子2N,不会影响m的选择,我们定义Akaike信息准则 (AIC)如下

在对时间序列数据拟合ARMA模型时,如果我们把高斯似然看做是真实似然函数,则AIC具有形式(在去掉一些常数之后)(www.xing528.com)

鉴于AIC趋向于对阶数过度估计这一事实,AICC对大的p和q值放一个较重的惩罚以消除AIC的过度估计倾向。

现在,假定我们对事先指定的L≥1,拟合一个阶为1≤p≤L的纯AR模型,令NT=N-L,基于条件高斯似然函数

它是由X1,X2,…,Xp的密度函数导出的完全似然函数,我们可以定义下列的AIC和AICC的简化版本

我们选择阶p,使得以上定义的AIC(p)或AICC(p)达到极小。以上论述表明在某些给定条件下可有效地把样本容量由N 减少到N′=N-L。当N 相对于L较大时,所选择的阶与由式 (5-41)和式 (5-42)导出的阶差别很小。

由此可见,AIC准则函数通常由两项构成,第一项体现了模型拟合的好坏,它随阶数的增大而变小;第二项体现了模型参数的多少,它随阶数的增大而变大,取二者之和的最大值意味着上述两个量的一种权衡。从p=0开始逐渐增加模型阶数,AIC(p)的值是下降的,因为此时起决定性作用的是第一项,即模型残差方差,当阶数p达到某一值p0时,AIC(p0)达到最小,然后,随着阶数p继续上升,残差方差下降甚微,起决定性作用的是第二项,从而AIC(p)的值随p而增长。此外,使用AIC时需要注意以下几个问题:

(1)AIC准则要求预先设定模型阶数的最大范围L,根据经验可知,阶数上限取,log N 均可,在比较AIC大小的过程中,如果已接近阶数上限仍不能确定AIC的极小点,则应加大上限,继续进行比较。

(2)AIC准则要求参数由最大似然法估计,但当序列不服从正态分布时,计算表明该准则也适用于最小二乘法估计。

(3)AIC准则是模型优化的一种宏观度量,但不宜机械地以绝对最小值来选择模型阶数,而是要在所对应的模型进行多方比较后,确定合理的模型阶数以及相应参数。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈