首页 理论教育 了解博弈论的基本要素与反应函数

了解博弈论的基本要素与反应函数

时间:2023-05-23 理论教育 版权反馈
【摘要】:为了说明博弈论研究的是经济活动主体在充分考虑对方反应的情况下如何进行决策,可先举一个“囚犯的困境”的例子。表6-1 囚犯的困境在表6-1中,甲、乙两囚犯称为局中人,他们是参与博弈(对策)并承担后果的利益主体,有时也称参与人。在所有博弈中,局中人、策略集合和收益,是三个最基本的要素。自己的最优产量因对方产量变动而变动的关系就是反应函数。两条反应函数曲线相交产生了均衡价格与产量。

了解博弈论的基本要素与反应函数

为了说明博弈论研究的是经济活动主体在充分考虑对方反应的情况下如何进行决策,可先举一个“囚犯的困境”的例子。

假定有甲乙两个作案嫌疑犯分别被关押审讯。如果两人都坦白,各判3年;都抵赖,各判1年(也许因无实据);一人坦白一人抵赖,坦白者释放,抵赖者判6年。这些结果可列一矩阵,如表6-1所示。

表6-1 囚犯的困境

在表6-1中,甲、乙两囚犯称为局中人,他们是参与博弈(对策)并承担后果的利益主体,有时也称参与人。这两个局中人在给定条件下可能坦白也可能抵赖的行动方案称为策略。所有局中人可能采取的行动方案总和称为策略集合,在本例中是“都坦白”“都抵赖”以及“甲坦白、乙抵赖”“甲抵赖、乙坦白”这样四种策略组合。在每种组合情况下局中人采取特定策略得到的结果称为收益,亦称支付。本例中判3年、6年、1年及释放都是收益,有时也称报酬或支付。

在所有博弈中,局中人、策略集合和收益,是三个最基本的要素。

在表6-1中,甲乙各有两种策略:坦白或抵赖。表中每一格内的前后两个数字分别代表甲、乙的收益。显然,不管乙坦白还是抵赖,甲最好的策略是坦白。这是因为,乙如果坦白,则甲坦白判3年,而抵赖要判6年;乙如果抵赖,则甲坦白可不判刑获释放,而抵赖要判1年。对乙来说,情况同样如此。结果,甲乙都坦白。这种策略组合称为上策均衡。在此,上策指不管其他局中人采取什么策略,某一局中人都采取自认为对自己最有利的策略,即独立于其他局中人选择的最优战略。均衡指博弈中所有局中人都不想改变自己策略的一种相对静止状态。上例中的均衡,由于是不管其他局中人采取什么策略,每个局中人都选择了对自己最有利的策略所构成的一个策略组合,因此称上策均衡。

囚犯困境中的均衡(坦白,坦白)是上策均衡,也是纳什均衡。纳什均衡是美国数学家纳什(John Nash)于1951年提出来的一种均衡理论。这种均衡是指参与博弈的每一局中人在给定其他局中人策略的条件下选择上策所构成的一种策略组合,纳什均衡意味着,没有任何局中人有积极性单方面改变自己的选择。例如,乙坦白时,甲最好也坦白;乙抵赖时,甲最好也是坦白。乙的情况同样如此。故双方都坦白不但是上策均衡,也是纳什均衡。所有上策均衡都是纳什均衡,但不能反过来说所有纳什均衡都是上策均衡。例如,假定甲乙二人在博弈中有如表6-2的收益矩阵。(www.xing528.com)

表6-2 纳什均衡

显然,该博弈没有上策均衡,因乙选A时,甲最好也选A(2>0);乙选B时,甲最好也选B(1>0),不存在不管乙采取策略A或B,甲总应采取某一策略的情况。对乙来说,同样如此。总之,在本例中,只存在给定对方某一策略时,甲或乙才能有正确的策略。这种策略组合构成纳什均衡。例中的左上(策略A,策略A)和右下(策略B,策略B)都是纳什均衡,但不是上策均衡。

上策均衡和纳什均衡在经济生活中大量存在。例如,卡特尔的价格和产量协议就是一个类似囚犯困境的上策均衡。假定甲乙二厂商组成一个卡特尔,结成价格和产量协议,它们在不同策略组合下的收益矩阵如表6-3所示。

表6-3 卡特尔的困境

在表6-3中,甲乙合作(守约),各得利1800;一方合作,另一方不合作(例如扩大产量)时,不守约一方可得利2000,守约一方只能得1000。由于双方都想欺骗对方以获更多利润,结果大家不守约,卡特尔瓦解,大家只能各得利1500。从这里可看到合作的集体利益与不合作的个体利益之间存在矛盾。

再看前面讲到的古诺模型,就是一个典型的纳什均衡模型,因为竞争双方都必须在对方有一既定产量前提下来决定自己利润最大化的产量。自己的最优产量因对方产量变动而变动的关系就是反应函数。两条反应函数曲线相交产生了均衡价格与产量。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈