首页 理论教育 矩阵对策的最优纯策略及性质分析

矩阵对策的最优纯策略及性质分析

时间:2023-05-16 理论教育 版权反馈
【摘要】:矩阵对策为二人有限零和对策。可以用表格10.2 表示上述寻找最优纯策略过程:表10-2故若双方都采取理智行为,局势为最佳纯策略。定理 1矩阵对策 G={S1,S2; A}在纯策略意义下有解的充要条件是:存在纯局势使得对任意i 和j,有证明先证充分性。这两条性质表明:矩阵对策的值是唯一的,即当一个局中人选择了最优纯策略后,他的赢得值不依赖于对方的纯策略。

矩阵对策的最优纯策略及性质分析

矩阵对策为二人有限零和对策。“二人”是指参加对策的局中人有两个;“有限”是指每个局中人的策略集均为有限集,这里的纯策略是指局中人的选择明确,即确定某种选择。

一般地,用Ⅰ和Ⅱ分别表示两个局中人,并设局中人Ⅰ有m 个纯策略(pure strategies)α1,…,αm,局中人Ⅱ有n 个纯策略β1,…,βn,则局中人Ⅰ和Ⅱ的策略集分别为S1={α1,…,αm}和S2={β1,…,βn}。

当局中人Ⅰ选定纯策略αi,局中人Ⅱ选定纯策略βj后,就形成了一个纯局势(αi,βj),这样的纯局势共有m*n 个。对任一纯局势(αi,βj),记局中人Ⅰ的赢得值为αij,称为局中人Ⅰ的赢得矩阵。由于对策为零和的,故局中人Ⅱ的赢得矩阵就是-A。

当局中人Ⅰ,Ⅱ的策略集S1,S2及局中人Ⅰ的赢得矩阵A 确定后,一个矩阵对策也就给定了,记为G={S1,S2; A}。在“齐王赛马”的例子中,齐王的赢得矩阵为

当矩阵对策模型给定后,各局中人面临的问题便是:如何选择对自己最有利的纯策略以取得最大的赢得(或最少所失)?下面用一个例子来分析各局中人应如何选择最有利策略。

例10-5 设一对策G={S,D,A},其中S={s1,s2,s3},D={d1,d2,d3},其赢得矩阵为:

问题:双方局中人采用何种策略最佳?

可以用表格10.2 表示上述寻找最优纯策略过程:

表10-2

故若双方都采取理智行为,局势(S1,d2)为最佳纯策略。

纯策略分析:

(1)局中人甲对每个策略si的评价值为

故局中人甲选择的策略模型为:

(2)局中人乙对每个策略 dj的评价值为:

故局中人乙选择的策略模型为:

例10-6 设有一矩阵对策G={S1,S2; A},其中

由A 可看出,局中人Ⅰ的最大赢得是9,他要想得到这个赢得,就得选择纯策略α3。由于假定局中人Ⅱ也是理智的竞争者,他考虑到局中人Ⅰ打算出α3的心理,便准备以β3对付,使局中人Ⅰ不但得不到9,反而失掉10。局中人Ⅰ当然也会猜到局中人Ⅱ的这种心理,故转而出α4来对付,使局中人Ⅱ得不到10,反而失掉6……所以,如果双方都不想冒险,都不存在侥幸心理,而是考虑到对方必然会设法使自己所得最少这一点,就应该从各自可能出现的最不利的情形中选择一个最有利的情形作为决策的依据,这就是所谓“理智行为”,也是对策双方实际上可以接受并采取的一种稳妥的方法。

在例10-6中,局中人Ⅰ在各纯策略下可能得到的最少赢得分别为:18,2,-10,13,其中最好的结果是2。因此,无论局中人Ⅱ选择什么样的纯策略,局中人Ⅰ只要以α2参加对策,就能保证他的收入不会少于2,而出其他任何纯策略,都有可能使局中人Ⅰ的收入少于2,甚至输给对方。同理,对局中人Ⅱ来说,各纯策略可能带来的最不利的结果是:9,2,6,其中最好的也是2,即局中人Ⅱ只要选择纯策略β2,无论对方采取什么纯策论,他的所失值都不会超过2,而选择任何其他的纯策略都有可能使自己的所失超过2。上述分析表明,局中人Ⅰ和Ⅱ的“理智行为”分别是选择纯策略α2和β2,这时,局中人Ⅰ的赢得值和局中人Ⅱ的所失值的绝对值相等,局中人Ⅰ得到了其预期的最少赢得2,而局中人Ⅱ也不会给局中人Ⅰ带来比2 更多的所得,相互的竞争使对策出现了一个平衡局势(α2,β2),这个局势就是双方均可接受的,且对双方来说都是一个最稳妥的结果。因此,α2和β2应分别是局中人Ⅰ和Ⅱ的最优纯策略。对一般矩阵对策,有如下定义

定义 2 设 G={S1,S2; A}为一矩阵对策,其中 S1={α1,…,αm},S2={β1,…,βn},A=(aijn,若

成立,记其值为VG,则称VG为对策的值,称使式(10.3)成立的纯局势为G 在纯决策意义下的解(或平衡局势),称分别为局中人Ⅰ和Ⅱ的最优纯策略。(www.xing528.com)

从例10-9 还可看出,矩阵A中平衡局势(α2,β2)对应的元素a22既是其所在行的最小元素,又是其所在列的最大元素,即有

将这一事实推广到一般矩阵对策,可得如下定理。

定理 1 矩阵对策 G={S1,S2; A}在纯策略意义下有解的充要条件是:存在纯局势使得对任意i 和j,有

证明 先证充分性。由式(10.5),有

另一方面,对任意i,j,由

由式(12.6)和式(12.7),有

现证必要性。设有i*,j*,使得

证毕。

对任意矩阵A,称使式(l0.5)成立的元素ai*j*为矩阵A的鞍点。在矩阵对策中,矩阵A的鞍点也称为对策的鞍点。

定理1中式(10.5)的对策意义是,一个平衡局势应具有这样的性质:当局中人Ⅰ选择了纯策略后,局中人Ⅱ为了使其所失最少,只能选择纯策略否则就可能失得更多;反之,当局中人Ⅱ选择了纯策略后,局中人Ⅰ为了得到最大的赢得也只能选择纯策略否则就会赢得更少,双方的竞争在局势下达到了一个平衡状态。

例10-7 设有矩阵对策G={S1,S2; A},其中

直接在A 提供的赢得表上计算,有

故(α1,β2),(α1,β4),(α3,β2),(α3,β4)都是对策的解,且VG=8。

由例10-10 可知,一般对策的解可以是不唯一的,当解不唯一时,解之间的关系具有下面两条性质:

性质1(无差别性) 若是对策G的两个解,则

性质2(可交换性) 若是对策G的两个解,则也是对策G的解。

上面两条性质的证明留给读者作为练习。这两条性质表明:矩阵对策的值是唯一的,即当一个局中人选择了最优纯策略后,他的赢得值不依赖于对方的纯策略。

例10-8 某单位采购员在秋天决定冬季取暖用煤的储量问题。已知在正常的冬季气温条件下要消耗15 吨煤,在较暖与较冷的气温条件下要消耗10 吨和20 吨。假定冬季时的煤价天气寒冷程度而有所变化,在较暖、正常、较冷的气候条件下每吨煤价分别为100 元、150元和200 元,又设秋季时的煤价为每吨100 元。在没有关于当年冬季准确的气象预报条件下,秋季储煤多少吨才能使单位的支出最少?

这一储量问题可以看成一个对策问题,把采购员当作局中人Ⅰ,他有三个策略:在秋天时买10 吨、15 吨与20 吨,分别记为α1,α2,α3。把大自然看作局中人Ⅱ(可以当作理智的局中人来处理),大自然(冬季气温)有三种策略:出现较暖的、正常的与较冷的冬季,分别记为β1,β2,β3。现在把该单位冬季取暖用煤实际费用(即秋季购煤时的费用与冬季不够时再补购的费用总和)作为局中人Ⅰ的赢得,得矩阵如下:

故对策的解为(α3,β3),即秋季储煤20 吨合理。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈