首页 理论教育 矩阵对策的混合策略:存在鞍点型充要条件

矩阵对策的混合策略:存在鞍点型充要条件

时间:2023-05-16 理论教育 版权反馈
【摘要】:定义3m 维概率向量称为局中人甲的一个混合策略,即局中人甲选择策略 Si的概率为xi。如局中人Ⅰ可制订这样一种策略:分别以概率选取纯策略α1和α2,称这种策略为一个混合策略。和定理1 类似,可给出矩阵对策G 在混合策略意义下解存在的鞍点型充要条件。

矩阵对策的混合策略:存在鞍点型充要条件

混合策略就是局中人考虑以某种概率分布来选择他的各个策略。

定义3 m 维概率向量称为局中人甲的一个混合策略,即局中人甲选择策略 Si的概率为xi

同理,可定义乙的混合策略。

由上面讨论可知,在一个矩阵对策G={S1,S2; A}中,局中人Ⅰ能保证的至少赢得是:

局中人Ⅱ能保证的至多所失是

一般地,局中人Ⅰ的赢得不会多于局中人Ⅱ的所失,故总有

当v1=v2时,矩阵对策在纯策略意义下有解,且VG=v1=v2。然而,实际中出现的更多情形是,这时,根据定义1,对策不存在纯策略意义下的解。例如,对赢得矩阵为

于是,当双方根据从最不利情形中选择最有利的原则选择纯策略,应分别选择α2和β1,此时局中人Ⅰ的赢得为5,比预期的至多赢得 v1=4还多。其原因在于局中人Ⅱ选择了β1,使局中人Ⅰ得到了本不该的赢得,故β1对局中人Ⅱ来说不是最优的,因此他会考虑出β2。局中人Ⅰ会采取相应的办法,改出α1以使赢得为6,而局中人Ⅱ有可能仍采取策略β1来对付局中人Ⅰ的策略α2。这样,局中人Ⅰ出α1和α2的可能性及局中人Ⅱ出β1和β2的可能性都不能排除,这对两个局中人来说,不存在一个双方都可以接受的平衡局势,即不存在纯策略意义下的解。在这种情况下,一个比较自然且合乎实际的想法是:既然局中人没有最优策略可出,是否可以给出一个选择不同策略的概率分布。如局中人Ⅰ可制订这样一种策略:分别以概率选取纯策略α1和α2,称这种策略为一个混合策略。同样,局中人Ⅱ也可以制订这样一种混合策略:分别以概率选取纯策略β1和β2。下面,给出矩阵对策混合策略及其在混合策略意义下解的定义。

定义4 设有矩阵对策G={S1,S2; A},其中S1={α1,…,αm},S2={β1,…,βn},A=(aijn,记

则分别称为局中人Ⅰ和Ⅱ的混合策略集(或策略集);对称x 和y为混合策略(或策略),(x,y)为混合局势(或局势)。局中人Ⅰ的赢得函数记为

为策略G的混合扩充。

不难看出,纯策略是混合策略的一个特殊情形。一个混合策略x=(x1,…,xnT可理解为:如果进行多局对策G的话,局中人Ⅰ分别选取纯策略 α1,…,αm的频率;若只进行一次对策,则反映了局中人Ⅰ对各纯策略的偏爱程度。

例10-9 “剪刀、石头、布”游戏。若B的混合策略为(0.4,0.3,0.3),

则A 选“石头”的期望赢得为:0×0.4+1×0.3+(-1)×0.3=0;

A 选“剪子”的期望赢得为:(-1)×0.4+0×0.3+1×0.3=-0.1;

A 选“布”的期望赢得为:1×0.4+(-1)×0.3+0×0.3=0.1。(www.xing528.com)

若又已知A的混合策略为(0.5,0.2,0.3),则A的期望赢得为:

同理,B的期望赢得为-0.01。

下面讨论矩阵对策在混合策略意义下解的概念。设两个局中人仍如前所述那样进行理智的对策,则当局中人Ⅰ选择混合策略x 时,他的预期所得(最不利的情形)是因此,局中人Ⅰ应选取使得

同理,局中人Ⅱ可保证的所失的期望值至多是

显然,有 v1≤v2

定义5 设矩阵对策是矩阵G={S1,S2; A}的混合扩充,如果

记其值为VG,则称VG为对策G的值,称使式(10.11)成立的混合局势(x*,y*)为G 在混合策略意义下的解(或平衡局势),称x*和y*分别为局中人Ⅰ和局中人Ⅱ的最优混合策略。

现约定,以下对矩阵G={S1,S2; A},即混合扩充一般不加以区别,都用G={S1,S2; A}来表示。当G 在纯策略意义下的解不存在时,自然认为讨论的是在混合策略意义下的解。

和定理1 类似,可给出矩阵对策G 在混合策略意义下解存在的鞍点型充要条件。

定理2 矩阵对策G 在混合策略意义下有解的充要条件是:存在使得对任意

例10-10 考虑矩阵对策G={S1,S2; A},其中

由前面讨论,已知G 在纯策略意义下无解,故设x=(x1,x2)和y=(y1,y2)分别为局中人Ⅰ和Ⅱ的混合策略,则

则局中人Ⅰ的赢得期望是

分别为局中人Ⅰ和Ⅱ的最优策略,对策的值(局中人Ⅰ赢得的期望值为)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈