首页 理论教育 占优均衡与劣策略反复消去均衡

占优均衡与劣策略反复消去均衡

时间:2023-04-06 理论教育 版权反馈
【摘要】:很显然,博弈中存在占优均衡时,预测参与人的策略选择已经有了一个可靠的结果。占优均衡也称为上策均衡。劣策略反复消去均衡就是基于理性人不会出劣策略的原理,反复消去劣策略,如果最后每个参与人都只有唯一策略,则这一剩下的策略组合称为劣策略反复消去均衡。这表明劣策略反复消去均衡的范畴比占优均衡的范畴要广,即占优均衡是劣策略反复消去均衡的特例,反之则不然。

占优均衡与劣策略反复消去均衡

有了博弈模型,分析的重点是找出均衡,均衡是博弈模型的解,实质是对参与人策略的理性预测。由于非合作博弈的假设中,参与人以自己的效用为唯一的衡量准则。因此,博弈的均衡需要满足效用的最优性,并且要能够为具有足够智力且极端个人主义的所有参与人共同接受。

在一个博弈中,如果参与人i具有这样一个策略,在这一策略下,其收益比选择其他策略有优势,而且,当其他参与人做出的任何选择时,此参与人i都存在这种优势,则这一策略称为参与人i的上策。

数字表达是:如果si是i的上策,则ui(si,s-i)>ui(si,s-i)∀si∈Si,∀s-i∈S-i。这里引入了记号S-i与s-i,直观上是指i以外的参与人的策略组合,即s-i=(s1,…,si-1,si+1,…,sn)。

今后s-i均在这一定义下使用。同理S-i的定义是S-i=S1×…×Si-1× Si+1×…×Sn

如果一个博弈中,某个参与人存在上策,可以预测,此参与人将以上策作为自己的选择。如果一个博弈中,每一个参与人都有上策,可以预测,每个参与人都会以上策作为自己的选择。

若每个参与人有上策,参与人i的上策为si,则战略组合(s1,…,sn)称为占优均衡。

参看表1.1表示的囚徒困境博弈,坦白是每个囚犯的上策,即(坦白,坦白)是囚徒困境的占优均衡。

很显然,博弈中存在占优均衡时,预测参与人的策略选择已经有了一个可靠的结果。谁愿放弃上策呢?占优均衡也称为上策均衡。

当然,存在上策均衡是特殊的,即一般地说,并非静态博弈都会有上策均衡,例如,在划拳游戏中,任何参与人不存在上策。实际上,构思一个游戏,这个游戏就不应该存在上策均衡,否则这一游戏就不会有吸引力

一、严格下策反复消除均衡

占优策略是基于某一策略相对于其它策略的绝对优势来思考的,同样我们可以考虑某一策略的劣势。如果某种策略在任何情况下收益都不会高于另一策略的收益,那么这一策略就称为劣策略(下策)。

用数字表示的形式是,如果s′i是参与人i的劣策略,则∃s″i∈Si,使ui(s′i, s-i)<ui(s″i,s-i)∀s-i∈S-i

显然,如果参与人i有占优策略,则所有的其他策略都是劣策略。

一个参与人,是否会选择劣策略呢?在理性的假设下,这是不可能的。因此,基于参与人不会选下策的事实,我们可以对原来的博弈作这样的简化:在战略集合中把某人的一个劣策略去掉,形成了一个更少策略集的博弈。理性人会认为去掉劣策略对他的博弈行为没有影响。因此,用去掉劣策略的博弈替代原博弈进行分析是不会改变博弈本质的。

表2.2表示一个简单的博弈。用以说明对劣策略的处理。

表2.2 存在劣策略的博弈

对参与人2,“右”是一个劣策略,因为“中”在任何情况下都比“右”的收益高。消去劣策略“右”,博弈形式为表2.3。

表2.3 消除“右”的博弈

表2.2的博弈与表2.3的博弈在直观上可以认为是等效的。

如果我们假设劣战略的消除对行为选择不会产生影响,就可以引出劣策略反复消除均衡。(www.xing528.com)

实际上,劣策略消除可以反复进行。如表2.3中又可注意到“下”是参与人1的劣策略。而消去参与人1的“下”后,“左”又是参与人2的劣策略。最后剩下的是以博弈只有参与人1的“上”与参与人2的“中”。

劣策略反复消去均衡就是基于理性人不会出劣策略的原理,反复消去劣策略,如果最后每个参与人都只有唯一策略,则这一剩下的策略组合称为劣策略反复消去均衡。

表2.2的博弈中,策略组合(上,中)就是劣策略反复消去均衡。

很显然,如果一个博弈中有占优均衡,则一定可以通过劣策略的反复消除来获得占优均衡。这表明劣策略反复消去均衡的范畴比占优均衡的范畴要广,即占优均衡是劣策略反复消去均衡的特例,反之则不然。实际上,表2.2的博弈中有劣策略反复消去均衡,但没有占优均衡。

一个博弈,反复消去劣策略时,可能会有不同的消去过程,如下例,

表2.4 多个劣策略博弈

显然,C是参与人1的劣策略,L与M是参与人2的劣策略。那么,先消去C与先消去M是否会有不同的结果呢?其实不必担心,如果存在劣策略反复消去均衡时,消去的先后不会影响最后的结果。因为某一策略如果是劣策略,在去掉一些劣策略后依然是劣策略,也即并不存在某个劣策略消除后另一个劣策略就不是劣策略的情况。这表明,不同的人去消除劣策略可能会有不同的过程,但最后结果是一致的。

在表2.4的博弈中,不论怎样消去劣战略,都得到(A,H)的均衡。

例2.2.1 智猪博弈

智猪博弈以一个故事的形式出现,然而该例子却与许多人类行为有相似的特征。

假设猪圈里有两头猪,一头大猪,一头小猪,猪圈的一端有一个猪食槽,另一端安装了一个按钮,控制猪食的供应。按一下按钮,将有8个单位的猪食进入猪食槽,供两头猪食用。两头猪面临选择的策略有两个:自己去按按钮或等待另一头猪去按按钮。如果某一头猪做出自己去按按钮的选择,它必须付出如下代价:第一,它需要支出相当于两个单位食物的成本;第二,由于猪食槽与按钮分别在两端,它将比另一头猪后到猪食槽,从而减少吃食的数量。假定:若大猪先到(小猪按按钮),大猪将吃到7个单位的猪食,小猪只能吃到1个单位的猪食;若小猪先到(大猪按按钮),大猪和小猪各吃到4个单位的猪食;若两头猪同时选择按时,大猪吃到5个单位的猪食,小猪吃到3个单位的猪食,但每头猪都要支付两个单位的成本,分别吃到了3份与1份;当然两头猪都不按开关时无食物供应。

智猪博弈的收益矩阵如表2.5所示。表中的数字表示两头猪在做出不同选择下每头猪所能吃到的猪食数量减去按按钮的成本之后的净值

表2.5 智猪博弈的收益矩阵

从表2.5中不难看出,在这个博弈中,等待是小猪的占优策略。而对大猪来说,它的选择就不是如此简单了。大猪的最优策略依赖于小猪的选择。如果小猪选择等待,大猪的最优策略是按按钮。这时,大猪能得到2个单位的净收益(4个单位猪食减去2个单位的按按钮成本),否则,大猪的净收益为0;如果小猪选择按按钮,大猪的最优策略显然是等待,这时大猪的净收益为7个单位。在这个博弈中,只有小猪有占优策略,而大猪没有占优策略。

那么这个博弈的均衡解是什么呢?这个博弈的劣策略反复消去均衡解是大猪选择按按钮,小猪选择等待。这时,大猪和小猪的净收益水平分别为2个单位和4个单位。这是一个“多劳不多得,少劳不少得”的均衡。

在找出上述智猪博弈的均衡解时,我们实际上是按照“重复剔除严格劣策略”的逻辑思路进行的。该思路可以归纳如下:首先找出某参与人的严格劣策略,将它剔除,重新构造一个不包括已剔除策略的新博弈;然后,继续剔除这个新的博弈中某一参与人的严格劣策略;重复进行这一过程,直到剩下惟一的参与人策略组合为止。剩下的这个惟一的参与人战略组合,就是这个博弈的均衡解,称为“重复剔除的占优策略均衡”,也称为劣战略反复消去均衡。所谓“严格劣策略”是指:不论其他参与人采取什么策略,此策略的收益都严格少于另一策略的收益。

由表2.5可以看出,无论大猪选择什么策略,小猪选择按按钮,是一个严格劣策略,我们首先加以剔除。在剔除小猪“按按钮”这一选择后的新博弈中,小猪只有“等待”一个选择,而大猪则有两个可供选择的策略。大猪在这两个可供选择的策略中,选择“等待”对大猪是一个严格劣策略,我们再剔除新博弈中大猪的严格劣策略等待。剩下的新博弈中只有小猪等待、大猪按按钮这一个唯一的策略组合,就是智猪博弈的最后均衡解,从而得到重复剔除的占优策略均衡。

现实生活中类似智猪博弈的情况也很多,如大企业与小企业在维护市场时的情况是类似的,股市中大机构要收集上市公司的信息,而小股东可以不去收购信息而等待大股东的努力。又如同处一地区的一家大企业,与一家小企业为了修一条路时,也面临着同样的情况。

然而劣策略反复消去均衡也不是相当普遍的均衡,许多博弈中不存在这种均衡。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈