首页 理论教育 基于一阶近似的分布函数求解方法及应用

基于一阶近似的分布函数求解方法及应用

时间:2023-07-28 理论教育 版权反馈
【摘要】:故而这里利用极值理论中的POT模型对边际分布函数进行估计。在得到Xi和Yj分布函数的近似解析表达式后,要得到L1和L2的分布函数,还需对N1和N2,即内、外部欺诈损失频度的分布函数进行求解。由L1,L2的表达式可知,其中,和分别为分布函数F1和G1的n重卷积。即由内部欺诈和外部欺诈导致的每次操作风险损失变量的分布函数均属于次指数分布族。也即操作风险损失强度的实际情况与次指数分布族的性质正好相符。

基于一阶近似的分布函数求解方法及应用

由操作风险损失的历史数据可知,操作风险的损失变量具有“重尾”的特性,因此,内外部欺诈的损失强度也具有“重尾”的特性。故而这里利用极值理论中的POT模型对边际分布函数进行估计。

下面首先介绍对随机和L1和L2中损失强度变量Xi、Yj的分布函数F1(x)和G1(y)的求解。由于对G1(y)的估计与对F1(x)的估计方法和步骤类似,故这里只给出对F1(x)进行估计的方法和步骤。

对于固定的阈值u1<x*(这里的x*是在假设分布函数F1(x)上端点有限的情况下,其有限的上端点的值),可通过计算得到其超阈值分布函数)为

其中,Xi-u1称为超阈值变量(excess)。

由Pickands定理可得,当阈值u1足够大时,上述分布函数可以由上面章节中介绍的广义Pareto分布(GPD)来近似,即用

来对超阈值分布函数近似。有关上述GPD的具体内容在上一小节中已经进行了比较详细的介绍,这里就不再赘述。

根据上一节介绍的GPD的性质以及商业银行操作风险损失数据的特点,利用ξ>0的GPD,即Pareto分布来对超阈值分布进行近似。令x=u1+z(z≥0),由式(4.2.1)可得,

故有,

其中,ξ1,β1是由内部欺诈引起的每次操作风险损失变量,即内部欺诈损失强度变量Xi对应的广义Pareto分布的参数。对G1(y)近似解的求解方法和步骤也与上述方法步骤类似,通过这些方法和步骤可知,

其中,ξ2,β2是由外部欺诈引起的每次操作风险损失变量,即外部欺诈损失强度变量Yj对应的广义Pareto分布的参数。

在得到Xi和Yj分布函数的近似解析表达式后,要得到L1和L2的分布函数,还需对N1和N2,即内、外部欺诈损失频度的分布函数进行求解。根据以往的经验以及一年期操作风险损失发生次数的历史数据特征,一般假设其分布为泊松分布,即分别设N1~P(λ1),N2~P(λ2)。

由L1,L2的表达式可知,

其中,分别为分布函数F1(x)和G1(y)的n重卷积。虽然前面已经得到了分布函数F1(x)和G1(y)的估计值,但是通过上式可知,对分布函数F(x)和G(y)进行求解计算时,需要涉及F1(x)和G1(y)的n重卷积,故要先对其卷积进行求解。由前面求得的F1(x)和G1(y)的表达式可知,若直接按照卷积的定义和它们的近似解进行求解,将会比较复杂,因此,这里根据Pareto分布函数的性质来对上述卷积进行求解。

就如大家所知道的那样,Pareto分布是次指数分布族S中的一员.而由前面计算得到的式(5.3.6)和式(5.3.7)中广义Pareto分布(xu1)和均为Pareto分布,故由次指数分布族的性质可得,F1(x)和G1(y)也为次指数分布族,即F1(x)∈S,G1(y)∈S。即由内部欺诈和外部欺诈导致的每次操作风险损失变量的分布函数均属于次指数分布族。关于这一点,也可以从实际情况或者说操作风险损失强度数据的特征与次指数分布族的性质相符合来说明。(www.xing528.com)

根据次指数分布族的定义可知,若有一组随机变量序列X1,…,Xn,它们之间相互独立且具有相同的分布函数(记为F)。若F∈S,即F属于次指数分布族,则有

即事件P{X1+X2+…+Xn>x}与事件P{max(X1,X2,…,Xn)>x}等价。上式可以理解为:对随机变量序列{X1,X2,…,Xn}的和X1+X2+…+Xn的大小有着决定性影响的因素是其中比较大的值。而根据已获取的商业银行操作风险损失数据可以发现,在某一段时间内,操作风险损失的总金额中,占其总量百分之八十以上的金额都是由为数不多的几个大额操作风险损失的金额组成的,这些大额的操作风险损失发生的总次数大约只占了操作风险损失次数总数的百分之二十。将这一现象与上式所表达的含义结合起来,即若将上式中的随机变量序列X1,X2,…,Xn看成是某一时限内由内部欺诈或外部欺诈导致的操作风险损失强度变量,则根据内、外部欺诈损失强度的实际情况,上式仍成立。也即操作风险损失强度的实际情况与次指数分布族的性质正好相符。

为了得到F(x)和G(y)的值,可以先求其生存函数的值。根据前面对Xi和Yj的假设,即{Xi,i∈ℕ}和{Yj,j∈ℕ}都是独立同分布的随机变量序列,其共同的分布函数分别为F1(x)和G1(y),且一年期内部欺诈导致的操作风险损失次数N1与其损失强度随机变量序列{Xi,i∈ℕ}相互独立,一年期外部欺诈导致的操作风险损失次数N2与其损失强度随机变量序列{Yj,j∈ℕ}也相互独立。由这些已给出的假设以及F1(x)∈S,G1(y)∈S,便可由Embrechts等(1997)给出的定理得出,对于

以及

其中,分别为的n重卷积,若∃ξ>0使得

由前面对N1,N2的分布假设可知,式(5.3.13)显然成立,故式(5.3.14)也成立。也就是说,当选取的x值足够大的时候,就可以分别得到内部欺诈总体损失分布函数和外部欺诈总体损失分布函数的生存函数的近似值,表示为:

N1,N2分别表示的是一年期内部欺诈和外部欺诈导致的操作风险损失发生的次数,也即内、外部欺诈的损失频度。根据前文假设,其分布函数为泊松分布,参数分别为λ1,λ2,即

因此,由前面计算得到的结果,以及由内外部欺诈损失频度的历史数据通过矩估计得到的E(N1)和E(N2)的估计值,就可以分别得到一年期内部欺诈总体损失和外部欺诈总体损失L1和L2的分布函数的估计值,分别表示为:

其中,分别为F1(x)和G1(y)的生存函数的估计值。根据式(5.3.6)和(5.3.7)以及前面的内容,设内部欺诈和外部欺诈的样本数据个数总和分别为n1,n2分别为内部欺诈和外部欺诈样本数据中超过阈值u1,u2的样本数据个数,则可分别估计1-F1(u1)和1-G1(u2)的值,再将估计出的ξ≠0时Gξ,β的值代入式(5.3.6)和(5.3.7)中可得F1(x)和G1(y)的估计值分别为:

其中分别为中各参数的估计值。

根据对N1、N2的假设,可用内部欺诈和外部欺诈的损失频度的历史数据以及矩估计的方法得到λ1和λ2(即N1和N2的期望值E(N1)和E(N2))的估计值。因此,最后可得

以上即为基于一阶近似的内部欺诈总体损失和外部欺诈总体损失分布函数,即边际分布函数的求解过程和方法。尽管该方法可以得到各边际分布函数解析解的上述结果,但是,从上述计算过程可知,其中涉及随机和的计算,这会导致计算结果的误差增大。因为在上述计算过程中,主要利用了次指数分布族的性质,即主要考虑那些对总体损失具有较大贡献的大额单个损失在最终操作风险中的作用,但实际上,包括这些大额单个损失在内,每个损失Xi和Yj均对总体损失有贡献,也均对最终的操作风险值起作用。故而利用上述随机和模型来计算得到的操作风险VaR值比实际的VaR值要小。这种误差的大小取决于损失变量的分布状况以及一年期损失频度的期望λ的大小,当损失变量分布函数的尾部不是很厚或者一年期损失频度的期望值比较大时,误差会比较大。因此,为了减小计算结果与实际结果之间的误差,Bcker和Sprittulla(2006)以实际偏差为依据给出了经过改进的下述均值修正模型来对内部欺诈总体损失和外部欺诈总体损失的分布函数进行求解。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈