首页 理论教育 混合策略平衡点的介绍

混合策略平衡点的介绍

时间:2023-07-27 理论教育 版权反馈
【摘要】:要是双方都采用扔硬币的办法,这就是双方都按照的比例来“混合”使用自己的两个策略。换句话说,只要甲坚持用的比例来混合自己的策略,就可以保证在许多盘重复之后,不输也不赢。这样,我们就发现,对那种没有鞍点的表,使用了混合策略,游戏又可以达到一种平衡点。回到文章中,所谓的混合策略就有权重的思想,这样又能找到一个游戏的平衡点,减少输赢。

混合策略平衡点的介绍

我们设想不平衡的游戏要重复玩很多盘,所以双方都可以根据进行的情况,来猜测对方的策略。

对于平衡的游戏,每一方都应该放心地抱住一个固定的策略不放。策略不怕公开,玩多少盘,结果总是一样。

对于不平衡的游戏就不同了。从上节的那个例子来看,甲如果发现乙总是指定第一竖行,他就可以指定第一横行,赢6分。因此,乙不能总是指定第一竖行,不然就太傻了。

斗智的结果,必然是大家都不断改变自己的策略。以甲为例,他就应该一会儿指定第一横行,一会儿指定第二横行。这种改变不能有规律,如果形成了规律,一旦被对方发现,他就会一败涂地。

双方既要不断地改变自己的策略,又要变化无常,那怎么办好呢?可以采用类似抓阄的办法,比如说可以扔一个硬币,看到落下来国徽朝上就指定第一行,数字向上就指定第二行。

要是双方都采用扔硬币的办法,这就是双方都按照的比例来“混合”使用自己的两个策略。

当然也可以按别的比例,比如按31比69的比例来“混合”自己的两个策略:在一个口袋里放好100个纸团,其中31个写上1,69个写上2,从口袋中随意摸出一个纸团,打开一看,上面写着几,就指定第几行。

如果甲用31比69的比例来混合自己的策略,乙用74比26的比例来混合自己的策略,那就可以按下面的办法来计算出平均每盘甲赢几分。

先在这个游戏表的左边和上边分别写上甲乙各按什么比例混合自己的策略:

在每一个数下面写一个数,这个数是这一横行最左边的数和这一竖行最上边的数的乘积,比如0.31×0.74=0.2294。这些数表示出现各种结果的机会有多大。

再把每一个数和它下面的数相乘加在一起:

6×0.2294+(-8)×0.0806+(-6)×0.5106+8×0.1794=-0.8968

这就是甲每盘平均得的分数。

你喜欢代数,不难算出一个公式来:如果甲用p比(1-p)的比例混合自己的策略,而乙用q比(1-q)的比例混合自己的策略,那么,用上面的办法可以算出,平均每盘可以得的分数是:

6pq-8p(1-q)-6(1-p)q+8(1-p)(1-q)。简化得(1-2p)(8-14q)。

这说明,如果,许多盘游戏的结果,平均说来就是平局,就是甲平均每盘赢0分。(www.xing528.com)

换句话说,只要甲坚持用的比例来混合自己的策略,就可以保证在许多盘重复之后,不输也不赢。即使乙了解到甲的这个比例,那也没有关系。

乙呢?最好是按的比例来混合自己的策略。因为时,8-14q=0。这个比例也不怕甲知道。

反过来,如果甲或者乙按别的比例来混合自己的策略,它就可能受到额外的损失。比如说乙要按的比例来混合自己的策略,那甲就可以固定选取第二横行。这样,有一半的机会甲会输6分,但也有一半的机会能赢8分,平均起来每盘赢:

这个游戏是很有趣的,你不妨试试。

这样,我们就发现,对那种没有鞍点的表,使用了混合策略,游戏又可以达到一种平衡点。

怎样对一般的游戏求出它的平衡点,并算出双方合理的比例,是一个很复杂的问题,我们这里不再往深里谈了,只顺便提一句:像“石头、剪子、布”这样的游戏,双方最好都按照的比例来出石头、剪子和布。

名师导读

前文中说道:如果每一个游戏中都有一个平衡点就好了,那么平衡点就是这次游戏的最少的输赢。可是很多游戏是没有平衡点的,那怎么办呢?

“权衡利弊”的“权”字大家一定不陌生,怎么权衡呢?数学家发明了“权重”。权重是指某一因素或指标相对于某一事物的重要程度,其不同于一般的比重,体现的不仅仅是某一因素或指标所占的百分比,强调的是因素或指标的相对重要程度,倾向于贡献度或重要性。在这里可以举一个例子,比如学期末评比免试生,免试生意味着不用参加考试却能在评定册上获得满分的成绩。作为老师应该知道,只考虑期末综合成绩是不可取的,因为平时的表现相当的重要,所以我们可以规定平时的测试卷的成绩占60%,期末综合的成绩占40%,如果一个孩子平时测试成绩总分395(平时有4次测试,每次满分100)期末综合成绩392(期末综合有4次测试,每次满分100),那么他参评的成绩就是395×60%+392×40%=393.8,这里的60%和40%就分别是平时测试和期末综合测试的权重,通过这个算式可以看出来教师对平时测验的重视。

如果你觉着还是不够重视,有的教师认为上课听课情况和作业完成质量才是最重要的,那么,就可以重新调节权重,比如可以有课堂分数,1—100分不等,教师给每一个孩子一个分数,然后让这个分数占参比分数的30%,再把所有作业打开,根据是否齐全、书写干净、改错等标准给一个1-100的分数,让这个分数占参评分数的30%,平时测试占40%,期末综合测试占30%。例如后表:

我们不能说哪一种更好,前者好操作,后者更关注学生的平时表现,也需要教师更用心的做工作。

现在你知道什么是权重了么?回到文章中,所谓的混合策略就有权重的思想,这样又能找到一个游戏的平衡点,减少输赢。

例:大学的每一学科的期末成绩都是平时成绩和期末试卷成绩的总和,但平时成绩占60%,期末成绩占40%,凯翔的平时成绩是100分,期末试卷成绩是90分,你知道他期末打了多少分么?

答案:100×60%+90×40%=96(分)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈