首页 理论教育 协作性博弈与执行模式的关系探析

协作性博弈与执行模式的关系探析

时间:2023-07-17 理论教育 版权反馈
【摘要】:传统理论认为,个体作为理性主体,其自我逐利的行为“自然”促进集体福利的增长。这种矛盾被称为“集体行动的困境”。斯坦把这种状态称为“共同背弃的困境”。[27]斯坦把博弈者协作以解决非合作问题的博弈模式称为“协作性博弈”,因非合作博弈均衡获得诺贝尔经济学奖的纳什亦称其为“非合作性博弈”。

协作性博弈与执行模式的关系探析

传统理论认为,个体作为理性主体,其自我逐利的行为“自然”促进集体福利的增长。亚当·斯密说:“各个人都不断努力地为自己所能支配的资本找到最有利的用途。他所考虑的固然不是社会利益,而是自身利益,但他对自身利益的研究自然会或者说必然会引导他选定最有利于社会的用途。即使他不打算促进公共利益,只是盘算自己的安全和自身的利益,这种行为往往比真正出于本意的情况下更能有效地促进社会利益。”[17]《集体行动的逻辑》的作者奥尔森对此提出反对——“认为从理性和寻求自我利益的行为这一前提可以逻辑地推出集团会从自身利益出发采取行动,这种观念是错误的……有理性的、寻求自我利益的个人不会采取行动以实现他们共同的和集团的利益”[18]。在很多时候,对个人利益的追求往往导致共同利益的丧失。两者并非传统经济学家认为的相辅相生,而是相克相冲。比如一个竞争性市场中,企业对产品更高的价格具有共同利益,但同时又都希望卖出尽可能多的产品,直到产出一件产品的成本超过其价格为止。在这里,更高价格的共同利益和更多产出——即更低价格的个体利益是针锋相对的。这种矛盾被称为“集体行动的困境”。在博弈论尚未广泛应用于社会学与经济学的20世纪60年代,奥尔森使用微分方程证明了组成小规模的集团或者在大集团之中使用外部强制和选择性激励来克服“集体行动的困境”。[19]随着20世纪80年代博弈论在经济学的广泛应用,奥尔森的“集体行动困境”得以在博弈论的范式之下重建和发展。在“集体行动困境”最为著名的博弈模型——“囚徒困境”中,双方合作、共同沉默所获得的共同利益最大,各自只判1年监禁。但在相互隔离的情况下,双方固然受到背弃同伴的诱惑——坦白的疑犯将获得自由而沉默者将被判10年监禁;但也畏惧被同伴背弃——即本方沉默、对方坦白导致同伴获得自由而己方被判10年监禁。在双方都不知道对方如何决策的情况下,理性聪明的疑犯即使知道共同沉默的利益最大,即只判1年监禁,但还是选择了最安全但获利其次的决策,即背弃同伴,坦白罪行,各自获得5年监禁。(如表1)

表1

在囚徒困境的博弈中,共同获得最低刑期1年监禁是共同利益所在,但是信息不通使得博弈者的支配性策略是互不信任,相互欺诈,最终各自获得较高刑期5年监禁。在这个共同利益和个体利益相互冲突的博弈中,没有外来干预的情况下,自然达到的结果是双方背弃,不能合作。这在政治学中用于解释国内政府的产生机理,也被用于解释国际社会无政府状态下的众多现象。斯坦在其《协作与协调——无政府世界的机制》中就使用同一博弈矩阵说明了大萧条时代贸易壁垒的成因。所有贸易往来中的国家都知道货物自由流通,拆除贸易壁垒的共同利益最大,假设是3。但是,每一单个国家都不愿意承担己方降低贸易壁垒,而其他国家保持贸易壁垒导致的“损己利人”的结果——假设单方降低贸易壁垒的国家只能从贸易往来中获利1,而保持贸易壁垒的国家能够从贸易往来中获利4。最终追随自己利益的理性国家将不管其他国家如何决策,选择提高贸易壁垒的政策,背弃其他国家,即使这一决策只能带来2的获利。斯坦说,这种共同背弃、相互欺诈的局势正是20世纪30年代国际贸易领域的现实,也是第二次世界大战结束之后各国想要避免的窘况。[20](如表2)

表2

从“集体行动困境”到“囚徒困境”,对于博弈者而言,共同利益都在相互合作和共同进退,即“帕累托最优”[21]在“合作”——以表2为例,落在(3,3)。但是,在缺乏外在干预和机制约束的情况下,以斯坦所举的大萧条时代各国贸易政策的困境为例,国家会选择最优方案,进行合作吗?每个独立决策的国家都面临背弃的诱惑——如果其他国家遵守约定,己方背弃将带来更高的收益,即单方面提高贸易壁垒,获得利益4;当然,也面临被背弃的恐惧——如果单方面遵守约定,选择合作,将带来更大的损失——单方面降低贸易壁垒只会给自己带来利益1,而维持壁垒的国家将获得利益4。张维迎先生生动地举例称:大家固然知道共同出钱兴办公用事业,所有人福利都会增加。但如果我出钱你不出钱,我得不偿失;如果你出钱我不出钱,我就可以占你便宜。最后每个人的最优选择都是“不出钱”。[22]务求私己利益最大化的博弈者最终的“自觉”选择都是不合作,以保证不论其他博弈者如何作为,己方都能获得最安全的收益。“纳什均衡”[23]落在共同背弃之上,偏离了“帕累托最优”的象限。斯坦把这种状态称为“共同背弃的困境”(dilemma of common aversions)。[24]埃莉诺·奥斯特罗姆指出,处于此类困境中的每个博弈者,其“不合作”策略牢牢压倒了“合作”策略。每个博弈者选择其最佳的个人策略所达到的均衡不是共同的最佳结果。每个博弈者都试图得到最佳结果(诱人的报偿)而避免最坏的结果(上当的报偿),最终得到次坏的结果。[25]博弈者的自觉选择之无效率与帕累托效率最优的相异,正是“集体行动”和“囚徒博弈”的困境所在。这种博弈者不欲为之,又不得不为的帕累托无效率正是各方对机制建立的需求所在。使用博弈论解释无政府状态下推动利己者实现合作的阿克塞罗德认为,在“囚徒困境”的原始故事中,如果能够增加被捕之囚犯背弃对方的黑暗前景,就可能扭转困境。比如,两个犯人同属一个帮派,他们都知道告密将受到严惩。这条惩罚规则大大降低了告密的收益值,他们会因为告密的成本太大(受到严惩)而各自放弃告密,选择共同沉默,最终获得最轻的判刑,达到“帕累托最优”的结果。[26]在群体内建立“告密者受罚”之机制就成为避免次坏结果的外在干预手段。“机制完全可以解决‘共同背弃的困境’问题。在这种困境之下,所有博弈者可能的战略也许并不指向同一偏好,但至少他们所有人都急欲‘避免’一种结果——协作(coordination)正是博弈者避免这种结果的必需。”[27]斯坦把博弈者协作以解决非合作问题的博弈模式称为“协作性博弈”,因非合作博弈均衡获得诺贝尔经济学奖的纳什亦称其为“非合作性博弈”。

通过以上的讨论,可以把“协作性博弈”的特点总结如下:(www.xing528.com)

第一,个体利益和集体利益相互冲突,个体背弃动机强烈。“囚徒困境反映了一个深刻的问题,即个人理性与团体理性的冲突。”[28]虽然相互合作将实现更大利益,但个体和集体的对抗性关系使得个体对于合作过程中可能出现的背弃导致私己利益的丧失更为恐惧而止步于自保,最终出现个体理性导致集体非理性的现象。在经济学领域对“集体行动的困境”进行开创性论证的哈丁在其著名的“公地悲剧”中阐述了这一现象——于公共牧场上放牧的每个理性人追求私己利益的最大化,希望多多养羊。但是在公共草地上,每增加一只羊会产生两种结果:一是获得增加一只羊的收入;二是加重草地的负担。经过利弊权衡,自利的牧羊者决定罔顾草地的承受能力而增加羊群数量,这对他们个人更加有利可图。当每个理性的牧羊人都如此行事的时候,牧场不堪重负,最终因过度使用而致荒凉。牧羊人追求个体利益最大化的行为导致公地的荒芜和集体利益的丧失。这就如我们在“囚徒博弈”中所见的,每个博弈者都不愿意为了共同的“最佳”结果而自己吃亏、冒险选择这一同时也可能是自己“最坏”的结果,最终的“均衡”落在“次坏”的结果上。“即使同一集团中对共同利益和实现共同利益的意见一致,除非在集团成员同意分担实现集团目标所需的成本的情况之下给予他们不同于共同或集团利益的独立激励,或者除非强迫他们这么做,否则一个大集团的成员有理性地寻求自我利益最大化,不会采取行动以增进共同目标或集团目标。”[29]对于将利益-成本视为行为指针的理性个体而言,如果不能在相互合作中获得大于参与合作所支付成本的收益,如果背弃也不必付出受罚的代价,这群“聪明人”不会选择合作。正如“囚徒困境”的博弈矩阵所展示的,唯一的纳什均衡点落在共同背弃之上,而这一象限是帕累托无效率的。也可以说,在“协作性博弈”中,“帕累托最优”和“纳什均衡”是不一致的。

第二,“协作性博弈”中“帕累托最优”和“纳什均衡”错置的原因在于个体“搭便车”和机会主义的倾向。可以把合作的过程视为公共产品的生产。其产出需要成本,而其消费却是“免费”,即奥尔森所说的公共产品消费“非排他性”和“非竞争性”的特点——合作的状态一旦形成,所有行为体都可以从中获利(非排他性),并且某一行为体的消费不会阻止其他行为体的获利(非竞争性)。“一件公共产品提供的是不可分利益的物品。只要它存在,每个人都可以从它那里获利,不管自己是否交纳了费用,也不管有多少别的人也从它那里获利。”[30]公共产品将自己的效用扩展于他人的成本为零,根本无法排除他人的共享。那么在制造公共产品,或者说缔结合作的过程中,每个理性人的个体利益最大化的“最佳”策略是避免承担建设成本,而最终能够共享公共产品,即零成本地获取公共产品。休谟指出:“要使一千个人共同排去他们共有草地的一片积水,乃是困难,而且的确是不可能的;他们对于这样一个复杂计划难以同心一致,至于执行这个计划就更加困难了,每个人都会寻找借口,想使自己省却麻烦和开支,而把全部负担加在别人身上。”[31]这种欲搭便车的机会主义心理,奥斯特罗姆在其《公共事物的治理之道》中阐述称,如果一个人不被排斥在分享由他人努力所带来的利益之外,就不会有动力为共同利益做出贡献,而只会选择做一个搭便车者。如果所有参与者都选择搭便车,集体利益将无法实现。[32]使用“协作性博弈”分析国际政治现象的苏长和先生认为,全球性公共物品具有典型的“非排他性”和“非对抗性”,加上行为体机会主义倾向的存在,导致全球公共问题的管理面临“搭便车”问题,造成供应或维护不足的困扰。在主体行为是由个体理性主导的世界里,个体会忽视全球公共事务的关心,或者不愿意承担治理全球公共问题的责任,这就造成了奥尔森所谓的“集体行动的困境”。[33]这种困境的本质,即上述“帕累托最优”和“纳什均衡”的不一致。溯其原因,正如斯坦所指出的,来自个体意欲成为“搭便车人”的动机,来自他们享受“非排他性”利益的动机。[34]唐斯也认为,在存在公共产品的社会里,由于公共产品的非市场性相互依赖,每个人的搭便车心理导致完全竞争状态之下,自愿行动将不会产生“帕累托最优”。[35]这意味着,如果无法克服机会主义和“搭便车”心理,公共产品其实无法产出,共同利益也无法达成,斯坦将这种困境也称为“共同利益的困境”。[36]

第三,突破“共同利益困境”的基本方法是对行为体背弃动机的遏制。如阿克塞罗德所认为的,在囚徒博弈的原始故事中,如果有帮派规则惩罚告密者,增加背弃的成本。意识到告密(背弃)成本高于收益的疑犯将大大降低告密的动机,而选择沉默(合作)。在上述表1的囚徒困境矩阵中,不论其他行为体作何决策,己方的“最佳”策略都是背弃,即“纳什均衡”落在(-5,-5)上,这是一个“次坏”的结果。欲实现(-1,-1)的“帕累托最优”,应该引入外部干预,强制性地改变个体报偿结构。比如上述表1的例证中,如果对背弃者进行惩罚导致其为背弃行为付出成本-20,低于其背弃可得利益0。那么放弃背弃,选择合作是更为划算和有效率的个体策略。给予足够的外在强制,改变“共同利益困境”中的报偿结构,是推动以成本—收益为行动指南的个体改变行为的有效方法。政治学在解释现代政府产生之原因的时候使用了这一视角——社会集合的本质即为囚徒困境,个体理性与集体理性相互对抗,形成“协作性博弈”。每个个体在自主决策的情况下,都欲通过背弃获得更多利益,主导策略是背弃,而共同背弃将导致集体帕累托的无效率。虽然共同协作被公认为集体最优的策略,却不是个体决策、形成均衡的结果。因此,人们集中在一起相互缔结社会契约,同意放弃部分自主性而授予政府制裁彼此的权力、以保证无人敢于利用他人的协作行为“搭便车”和意图背弃。当个体因为背弃受到制裁,其由此支付的高于背弃所得收益的成本将迫使个体进入相互协作的轨道。外部制裁,就是解决个体理性和集体理性冲突的方法,政府正承担了这样的职能。它像控制野马的缰绳,驱使个体避开理性选择的主导策略,驰入集体“最佳”,而非个体决策相互均衡(同时也是帕累托无效率)的结果。在国际社会,“政府”的缺位导致“协作性博弈”中,个体理性和集体理性冲突的解决所需要的外部强制长期依靠受害国或相关国家的自助执法和报复实现。这种“一报还一报”的强制方法虽然“能够”在无政府状态之下实现合作,但其不足和缺陷也引发了巨大灾难和国际社会的警觉。如上文述,第二次世界大战结束之后,大量国际法实施的国际机制出现,以控制国家自助执法的弊端,力图在机制的层面上实施法律制裁和执行国际法律。这些“执行模式”的国际机制在改变国际违法行为的报偿结构,解决“协作性博弈”,实现国际法共同遵守方面发挥了重要作用。

综上,在“协作性博弈”的解释框架之内,个体利益与集体利益的相互冲突是由理性个体“搭便车”和机会主义心理造成的。解决个体利益与集体利益的相互冲突,遏制个体“搭便车”的动机需要相互协作对背弃者实施强制。任何机制——不管是国内政府还是国际机制,通过向背弃者施加强制,人为改变“协作性博弈”的报偿结构以引导博弈者选择帕累托最优的,同时也是集体利益最大化的决策。这正是蔡斯所称的国际机制之“执行模式”的基本内容——作为解决“协作性博弈”的条约机制,必须装上锋利的牙齿,使用某种形式的强制性执行措施,对违反条约者加以“惩罚”。[37]斯坦以军备控制条约为例阐述了同样的观点——在安全困境中,所有行为体都知道相约控制军备是共同利益所在,但依然扩张军备。在此,遵守还是违反军备控制的国际法成为一个囚徒困境,当然,国家的主导战略是违法,因为所有国家都希望其他缔约方控制军备,而己方依然保持军备,这种“搭便车”心理和机会主义导致背弃的风险非常高。这决定了“军备控制条约的机制必须能够持续地监督和关注遵守问题。它们必须能够迅速地确认背弃并给予惩罚,保证条约得到遵守”[38]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈