工作计划

年度工作

工作规划

教学计划

实施方案

工作方案

教学工作

发展计划

德育工作

管理工作

发展规划

工作总结

教育工作

体育教师

年度计划

后勤工作

安全教育

工作思路

教育计划

小学教师

幼儿教师

数学教师

食品安全

英语教学

› 首页 › 理论教育 ›矩阵对策的混合策略:存在鞍点型充要条件

矩阵对策的混合策略:存在鞍点型充要条件

时间：2026-01-22 理论教育蝴蝶版权反馈

【摘要】：定义3m 维概率向量称为局中人甲的一个混合策略，即局中人甲选择策略 Si的概率为xi。如局中人Ⅰ可制订这样一种策略：分别以概率选取纯策略α1和α2，称这种策略为一个混合策略。和定理1 类似，可给出矩阵对策G 在混合策略意义下解存在的鞍点型充要条件。

混合策略就是局中人考虑以某种概率分布来选择他的各个策略。

定义3　m 维概率向量称为局中人甲的一个混合策略，即局中人甲选择策略 Si的概率为xi。

同理，可定义乙的混合策略。

由上面讨论可知，在一个矩阵对策G＝{S1，S2； A}中，局中人Ⅰ能保证的至少赢得是：

局中人Ⅱ能保证的至多所失是

一般地，局中人Ⅰ的赢得不会多于局中人Ⅱ的所失，故总有

当v1＝v2时，矩阵对策在纯策略意义下有解，且VG＝v1＝v2。然而，实际中出现的更多情形是，这时，根据定义1，对策不存在纯策略意义下的解。例如，对赢得矩阵为

于是，当双方根据从最不利情形中选择最有利的原则选择纯策略，应分别选择α2和β1，此时局中人Ⅰ的赢得为5，比预期的至多赢得 v1=4还多。其原因在于局中人Ⅱ选择了β1，使局中人Ⅰ得到了本不该的赢得，故β1对局中人Ⅱ来说不是最优的，因此他会考虑出β2。局中人Ⅰ会采取相应的办法，改出α1以使赢得为6，而局中人Ⅱ有可能仍采取策略β1来对付局中人Ⅰ的策略α2。这样，局中人Ⅰ出α1和α2的可能性及局中人Ⅱ出β1和β2的可能性都不能排除，这对两个局中人来说，不存在一个双方都可以接受的平衡局势，即不存在纯策略意义下的解。在这种情况下，一个比较自然且合乎实际的想法是：既然局中人没有最优策略可出，是否可以给出一个选择不同策略的概率分布。如局中人Ⅰ可制订这样一种策略：分别以概率选取纯策略α1和α2，称这种策略为一个混合策略。同样，局中人Ⅱ也可以制订这样一种混合策略：分别以概率选取纯策略β1和β2。下面，给出矩阵对策混合策略及其在混合策略意义下解的定义。

定义4　设有矩阵对策G＝{S1，S2； A}，其中S1＝{α1，…，αm}，S2＝{β1，…，βn}，A=（aij）m×n，记

则分别称为局中人Ⅰ和Ⅱ的混合策略集（或策略集）；对称x 和y为混合策略（或策略），（x，y）为混合局势（或局势）。局中人Ⅰ的赢得函数记为

称为策略G的混合扩充。

不难看出，纯策略是混合策略的一个特殊情形。一个混合策略x=（x1，…，xn）T可理解为：如果进行多局对策G的话，局中人Ⅰ分别选取纯策略 α1，…，αm的频率；若只进行一次对策，则反映了局中人Ⅰ对各纯策略的偏爱程度。

例10-9 “剪刀、石头、布”游戏。若B的混合策略为（0.4，0.3，0.3），

则A 选“石头”的期望赢得为：0×0.4+1×0.3+（-1）×0.3＝0；

A 选“剪子”的期望赢得为：（-1）×0.4+0×0.3+1×0.3＝-0.1；

A 选“布”的期望赢得为：1×0.4+（-1）×0.3+0×0.3＝0.1。(https://www.xing528.com)

若又已知A的混合策略为（0.5，0.2，0.3），则A的期望赢得为：

同理，B的期望赢得为-0.01。

下面讨论矩阵对策在混合策略意义下解的概念。设两个局中人仍如前所述那样进行理智的对策，则当局中人Ⅰ选择混合策略x 时，他的预期所得（最不利的情形）是因此，局中人Ⅰ应选取使得

同理，局中人Ⅱ可保证的所失的期望值至多是

显然，有 v1≤v2。

定义5　设矩阵对策是矩阵G＝{S1，S2； A}的混合扩充，如果

记其值为VG，则称VG为对策G的值，称使式（10.11）成立的混合局势（x*，y*）为G 在混合策略意义下的解（或平衡局势），称x*和y*分别为局中人Ⅰ和局中人Ⅱ的最优混合策略。

现约定，以下对矩阵G＝{S1，S2； A}，即混合扩充一般不加以区别，都用G＝{S1，S2； A}来表示。当G 在纯策略意义下的解不存在时，自然认为讨论的是在混合策略意义下的解。

和定理1 类似，可给出矩阵对策G 在混合策略意义下解存在的鞍点型充要条件。

定理2　矩阵对策G 在混合策略意义下有解的充要条件是：存在使得对任意有

例10-10　考虑矩阵对策G＝{S1，S2； A}，其中

由前面讨论，已知G 在纯策略意义下无解，故设x=（x1，x2）和y=（y1，y2）分别为局中人Ⅰ和Ⅱ的混合策略，则

则局中人Ⅰ的赢得期望是

故分别为局中人Ⅰ和Ⅱ的最优策略，对策的值（局中人Ⅰ赢得的期望值为）

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。