首页 理论教育 囚徒困境”:选择难题解析

囚徒困境”:选择难题解析

时间:2023-05-11 理论教育 版权反馈
【摘要】:“囚徒困境”中,囚犯为什么面临着两难选择?从此以后 类似的博弈问题便有了一个专门名称——“囚徒困境”。借着这个故事和名称,“囚徒困境”广为人知,在哲学、伦理学、社会学、政治学、经济学乃至生物学等学科中,获得了极为广泛的应用。所谓的“囚徒困境”,大意是这个样子的:甲、乙两个人一起携枪准备作案,被警察发现抓了起来。自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。

囚徒困境”:选择难题解析

“囚徒”的选择为什么困难?

“囚徒困境”中,囚犯为什么面临着两难选择?原因是他们都不知对方会怎么选择,即缺少信息,而且,两者之间的博弈动态的,并相互影响。

1950年,数学家塔克任斯坦福大学客座教授,在给一些心理学家作讲演时,他用两个囚犯的故事,将当时专家们正研究的一类博弈论问题,作了形象化的解释。从此以后 类似的博弈问题便有了一个专门名称——“囚徒困境”。借着这个故事和名称,“囚徒困境”广为人知,在哲学伦理学社会学政治学经济学乃至生物学等学科中,获得了极为广泛的应用。

所谓的“囚徒困境”,大意是这个样子的:

甲、乙两个人一起携枪准备作案,被警察发现抓了起来。警方怀疑,这两个人可能还犯有其他重罪,但没有证据。于是分别进行审讯,为了分化瓦解对方,警方告诉他们,如果主动坦白,可以减轻处罚;顽抗到底,一旦同伙招供,你就要受到严惩。当然,如果两人都坦白,那么所谓“主动交代”也就不那么值钱了,在这种情况下,两人还是要受到严惩,只不过比一人顽抗到底要轻一些。在这种情形下,两个囚犯都可以作出自己的选择:或者供出他的同伙,即与警察合作,从而背叛他的同伙;或者保持沉默,也就是与他的同伙合作,而不是与警察合作。这样就会出现以下几种情况(为了更清楚地说明问题,我们给每种情况设定具体刑期):

如果两人都不坦白,警察会以非法携带枪支罪而将二人各判刑1年;

如果其中一人招供而另一人不招,坦白者作为证人将不会被起诉,另一人将会被重判15年;

如果两人都招供,则两人都会因罪名各判10年。

这两个囚犯该怎么办呢?是选择互相合作还是互相背叛?从表面上看,他们应该互相合作,保持沉默,因为这样他们俩都能得到最好的结果——只判刑1年。但他们不得不仔细考虑对方可能采取什么选择。问题就这样开始了,甲、乙两个人都十分精明,而且都只关心减少自己的刑期,并不在乎对方被判多少年(人都是有私心的嘛)。(www.xing528.com)

甲会这样推理:假如乙不招,我只要一招供,马上可以获得自由,而不招却要坐牢1年,显然招比不招好;假如乙招了,我若不招,则要坐牢15年,招了只坐10年,显然还是以招认为好。无论乙招与不招,我的最佳选择都是招认。还是招了吧。

自然,乙也同样精明,也会如此推理。

于是两人都作出招供的选择,这对他们个人来说都是最佳的,即最符合他们个体理性的选择。照博弈论的说法,这是本问题的惟一平衡点。只有在这一点上,任何一人单方面改变选择,他只会得到较差的结果。而在别的点,比如两人都拒认的场合,都有一人可以通过单方面改变选择,来减少自己的刑期。

也就是说,对方背叛,你也背叛将会更好些。这意味着,无论对方如何行动,如果你认为对方将合作,你背叛能得到更多;如果你认为对方将背叛,你背叛也能得到更多。你背叛总是好的。这是一个有些让人寒心的结论。

为什么聪明的囚犯,却无法得到最好的结果?两个人都招供,对两个人而言并不是集体最优的选择。无论对哪个人来说,两个人都不招供,要比两个人都招供好得多。

囚徒困境假定每个参与者(即“囚徒”)都是利己的,即都寻求最大自身利益,而不关心另一参与者的利益。参与者某一策略所得利益,如果在任何情况下都比其他策略要低的话,此策略称为“严格劣势”,理性的参与者绝不会选择。结果,两个嫌疑犯都选择坦白,各判刑八年。如果两人都抵赖,各判一年,显然这个结果好。但这个帕累托改进办不到,因为它不能满足人类的理性要求。囚徒困境所反映出的深刻问题是,人类的个人理性有时能导致集体的非理性——聪明的人类会因自己的聪明而作茧自缚。

囚犯为什么要面临着两难选择?原因是他们都不知对方会怎么选择,即缺少信息。在我们玩剪刀、石头和布时,同样也无法确定对方会出哪一个,即缺少信息。此类过程与下围棋有点不同,围棋是每人轮流下棋,局面是清楚的。而我们常说的博弈则是两人同时在下棋,比如说我们去竞暗标,结果只有最后知晓。我们不可能知道对方的底细,只能根据以往历史经验进行判断。同样,对方也是采用类似的方法来判断我们。类似于玩剪刀、石头和布,两方互相猜心眼。由于多方同时在操作,这意味着没有绝对获胜的策略。为了最大化自己的收益,必须依赖概率进行选择。

自行车赛事的比赛策略也是一种博弈,而其结果可用囚徒困境的研究成果解释。例如每年都举办的环法自由车赛中有以下情况:选手们在到终点前的路程常以大队伍(英文:Peloton)方式前进,他们采取这策略是为了令自己不至于太落后,又出力适中。而最前方的选手在迎风时是最费力的,所以选择在前方是最差的策略。通常会发生这样的情况,大家起先都不愿意向前(共同背叛),这使得全体速度很慢,而后通常会有二或多位选手骑到前面,然后一段时间内互相交换最前方位置,以分担风的阻力(共同合作),使得全体的速度有所提升,而这时如果前方的其中一人试图一直保持前方位置(背叛),其他选手以及大队伍就会赶上(共同背叛)。而通常的情况是,在最前面次数最多的选手(合作)通常会到最后被落后的选手赶上(背叛),因为后面的选手骑在前面选手的冲流之中,比较不费力。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈