首页 理论教育 平均互信息的性质解析

平均互信息的性质解析

时间:2023-06-25 理论教育 版权反馈
【摘要】:平均互信息只与信源概率分布和信道转移概率有关,因此对于不同信源和不同信道得到的平均互信息是不同的。为此,可以得到有关平均互信息凸性质如下:性质2.34(上凸性) 平均互信息I(X;Y)是输入信源概率分布P的∩形函数。证明 先证明性质2.34,根据∩形函数的定义来进行证明。性质2.36 在三维离散联合随机变量集XYZ上,平均互信息、平均联合互信息和平均条件互信息有下列关系:证明 由平均联合互信息的定义得

平均互信息的性质解析

性质2.31非负性)I(X;y=bjI(X;Y)是非负的

978-7-111-51126-7-Chapter02-125.jpg

且当XY统计独立时,等式成立。

证明 根据式(2.52),直接应用不等式lnxx-1(x>0)得

978-7-111-51126-7-Chapter02-126.jpg

所以,IXy=bj)≥0。而由式(2.54)得

IXY)=EY[IXy=bj)]≥0

因为,仅当x=1时,lnxx-1的等式成立。所以978-7-111-51126-7-Chapter02-127.jpg,即Px)=Px|y=bj)时,式(2.60)和式(2.61)的等式成立。而Px)=Px|y=bj)说明,XY统计独立。

【证毕】

平均互信息的非负性表明,从整体和平均的意义上来说,信源消息通过信道传输到收信端后,收信者总能从收到的消息中获取到信源的信息量,等效于总能使信源的不确定度有所下降。也可以说,从一个事件提取关于另一个事件的平均信息,在最坏情况下是信息量为零,不会由于知道了一个事件,反而使另一个事件的不确定度增加。

如果从人们学习的角度来看互信息,则说明当经过一段时间的学习后,人们的知识量和文化修养总会有所提高。

性质2.32极值性 平均互信息I(X;Y)分别小于等于XY的熵

IXY)≤HX) (2.62)

IXY)≤HY) (2.63)

证明 因为IXY)=HX)-HX|Y),而条件熵HX|Y)为非负,故式(2.62)成立。同理,式(2.63)也成立。

【证毕】

性质2.33互易对称性I(X;Y)=I(Y;X)。

证明 将式(2.55)中的变量XY互换,得IYX)=HY)-HY|X),再与式(2.56)比较,可得IXY)=IYX)。

【证毕】

将式(2.55)和式(2.56)重写如下:

978-7-111-51126-7-Chapter02-128.jpg

结合等式978-7-111-51126-7-Chapter02-129.jpg可见,平均互信息IXY)是输入信源X的概率分布Px)和信道转移概率Py|x)的函数,即IXY)=I[Px),Py|x)]。平均互信息只与信源概率分布和信道转移概率有关,因此对于不同信源和不同信道得到的平均互信息是不同的。为此,可以得到有关平均互信息凸性质如下:

性质2.34上凸性 平均互信息I(X;Y)是输入信源概率分布P(x)的∩形函数又称上凸函数)。

性质2.35下凸性 平均互信息I(X;Y)是信道转移概率分布P(y|x)的∪形函数又称下凸函数)。

证明 先证明性质2.34,根据∩形函数的定义来进行证明。(www.xing528.com)

先固定信道,即固定信道转移概率Py|x),则IXY)仅是信源概率分布Px)的函数,简写为I[Px)]。设信源的两种概率分布为P1x)、P2x),对应的平均互信息分别为I[P1x)]和I[P2x)]。取978-7-111-51126-7-Chapter02-130.jpg,令978-7-111-51126-7-Chapter02-131.jpg,可知Px)满足概率分布条件,对应Px)的平均互信息记为I[Px)]。现要证明978-7-111-51126-7-Chapter02-132.jpg978-7-111-51126-7-Chapter02-133.jpg。计算

978-7-111-51126-7-Chapter02-134.jpg

978-7-111-51126-7-Chapter02-135.jpg,因此IXY)是信源概率分布Px)的∩形函数(又称上凸函数)。

再证明性质2.35,根据∪形函数的定义来进行证明。

先固定信源,即固定信源概率Px),则IXY)仅是信道转移概率Py|x)的函数,简写为I[Py|x)]。设信道的两种概率分布为P1y|x)、P2y|x),对应的平均互信息分别为I[P1y|x)]和I[P2y|x)]。取0<θ<1和978-7-111-51126-7-Chapter02-136.jpg,令978-7-111-51126-7-Chapter02-137.jpg,可知Py|x)满足概率分布条件,对应Py|x)的平均互信息为I[Py|x)]。现要证明978-7-111-51126-7-Chapter02-138.jpg。计算

978-7-111-51126-7-Chapter02-139.jpg

978-7-111-51126-7-Chapter02-140.jpg,因此IXY)是信道转移概率分布Py\x)的∪形函数(又称下凸函数)。

【证毕】

【例2.27】

二元离散随机变量XY的值域相同(皆为A:{0,1})。设X的概率分布为Px=0)=ω978-7-111-51126-7-Chapter02-141.jpgXY之间的条件概率为Py=0|x=0)=P978-7-111-51126-7-Chapter02-142.jpg978-7-111-51126-7-Chapter02-143.jpg。计算Y的概率分布为

978-7-111-51126-7-Chapter02-144.jpg

计算平均互信息IXY)为

978-7-111-51126-7-Chapter02-145.jpg

可见,IXY)是信源X的概率ω和条件概率p的函数。固定条件概率pIXY)与信源X的概率ω的函数关系如图2.4a所示,这是一个上凸函数,当ω=1/2时(等概率分布时),IXY)取最大值IXY)=1-Hp)。固定信源X的概率ωIXY)与条件概率p的函数关系如图2.4b所示,这是一个下凸函数,当p=1/2时,IXY)取最小值IXY)=0。

978-7-111-51126-7-Chapter02-146.jpg

图2.4 二元信源的熵函数

a)IXY)与ω的函数关系 b)IXY)与p的函数关系

如果把条件概率Py|x)视为信道的转移概率,则性质2.35说明,当信道固定时存在一种最佳信源输入分布Px),使输出端获得的平均信息量最大。

性质2.36 在三维离散联合随机变量集XYZ平均互信息平均联合互信息和平均条件互信息有下列关系

978-7-111-51126-7-Chapter02-147.jpg

证明 由平均联合互信息的定义得

978-7-111-51126-7-Chapter02-148.jpg

【证毕】

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈