首页 理论教育 多边环境协定中常见的博弈分析

多边环境协定中常见的博弈分析

时间:2023-07-29 理论教育 版权反馈
【摘要】:我们以 《京都议定书》 为例进行说明。加入并批准了 《京都议定书》 的国家, 同意合作以减少化石能源的消耗并进而降低温室气体的排放量对包括本国在内的国际社会是有益的。例如, 一国为了遵守 《京都议定书》 规定的限制二氧化碳排放的义务, 在国内设立了碳税, 这符合其国家利益。但是, 如果该国不遵守 《京都议定书》 的规定, 不在国内采取限制化石行业的立法和措施, 它将获得更大的收益。

多边环境协定中常见的博弈分析

(一) 囚徒困境博弈

著名的囚徒困境博弈描述了这样一个故事: 两个囚徒共同犯了一起严重罪行。 如果两个囚徒都保持沉默, 就难以取得他们犯罪的证据, 在这种情况下, 他们会被判较轻的刑罚, 例如非法持有武器, 入狱1年。 如果他们其中一人坦白了, 并提供另一个人犯罪的证据, 那么, 坦白者就会被立即无罪释放, 而另一个囚徒就会面临入狱30年的刑罚。 如果两个囚徒都坦白, 并互相提供对方犯罪的证据, 那么, 两个囚徒都会被判入狱15年 (见表1)。

表1 囚徒困境博弈

两个囚徒具有共同利益, 因为当他们都保持沉默时, 他们只会被判处较短的1年刑期。 这是他们达到了帕累托最优的福利最大化, 因为这时不可能提高一个囚徒的待遇水平而不降低另一个囚徒的待遇水平。

但是, 作为理性人, 每个囚徒都有坦白的愿望, 因为他有下述三种考虑:

如果另一个囚徒沉默, 而他坦白了, 那么, 他不会被判1年徒刑, 而会被立即释放;

如果另一个囚徒坦白, 而他沉默, 那么, 他会被判处30年徒刑;

如果另一个囚徒坦白, 而他也坦白了, 那么, 他不会被判入狱30年,而只有15年徒刑。

上述考虑的前提条件是两个囚徒被相互隔离, 他们不可能影响对方的决策, 也不能达成具有约束性的和可执行的协议。 于是, 可以预期两人都会坦白并提供对方犯罪的证据。 囚徒困境证明: 在信息无法沟通的情形下, 个人无法影响他人决策, 个体理性无法导出集体理性。 如果再进一步进行分析,我们会发现: 在该博弈图式下, 如果不能确定对手采取什么战略, 理性的决策者会认为, 背叛 (或者不合作) 给自己带来的收益是最大的, 但每个博弈方都采取自认为是理性的背叛战略时, 那么对集体而言, 会导致一种非理性的A2B2结果的出现。 囚徒困境博弈实际上告诉我们集体行动过程中个体理性与集体理性的反论问题, 即个体追求自身利益最大化的理性行为, 结果并不必然地就是集体理性的, 或者反过来说, 当存在需要实现的共同利益之集体理性目标时, 理性的个体往往不会采取合作性的集体行动, 去追求或守护公共的利益。 博弈方都只把他人的利益作为自己利益实现的参照因素来考虑, 即其他人的行动会对自己的利益实现造成什么样的影响, 而不会把其他人的利益作为他行动的一个目的来考虑。 也即 “决策者知道他的行动只为他自己着想, 他知道其他人的行动只为他们自己打算, 他也知道其他人知道他的行动只为他自己着想。”[5]在此情境下, 当这些个体进行集体博弈时,他们相互之间就会采取不合作的态度。 因此, 在这种公共事务的管理与治理过程中, 个体理性成了公共利益实现的障碍之一。

可以看出, 信息沟通是解决囚徒困境的重要条件, 但另一方面, 信息的沟通和改善并不是克服囚徒困境的充分保证因素。 囚徒困境是一种典型的非合作性博弈, 克服非合作的囚徒困境的关键问题在于, 如何使个体理性与集体理性统一起来。 由于囚徒困境博弈中存在个体理性行动与集体理性需求内在背离的张力, 因此, 为了实现最大化的公共利益, 必要的时候就必然需要一种有约束力的机构迫使个体理性的行动接近集体理性的需求, 这样, 具有惩罚、 制裁性质的约束力量就成为克服囚徒困境下的非合作行为的关键所在。 从后面的章节可以看出, 现阶段几个多边环境协定的遵守机制的设计理念可以说体现了这一点的考量基础: 它是一种介于有约束力的强制体制与倡导型的诱导体制之间的特殊程序。

我们以国际环境法教科书中经常引用的排放污染现象为例来分析囚徒困境博弈的出现和各国在解决该环境问题上的微妙心态。 当每个国家都不受限制地排放污染物, 且每个国家都认为在别国不受限制地排放污染物的同时,自己单方面限制污染物排放量于整个环境的治理无根本性的帮助, 或者每个国家都认为在其他国家联合限制污染物排放量的情况下, 自己单方面扩大污染物排放量不会对整体环境质量产生决定性影响时, 那么全球环境变化的最终结果必然成为哈丁描述的 “公地的悲剧”。 其实质是制度化的全球公共物品是以联合供给和联合消费形式表现出来的, 由于权责不明、 产权不清, 就会产生类似困境。

作为一种全球公共物品, 多边环境协定也同样面临着与囚徒困境博弈相似的情形。 各国针对某种国际环境问题达成一项国际条约, 国际条约对参加国家规定了约束性或者控制性的义务。 我们以 《京都议定书》 为例进行说明。 加入并批准了 《京都议定书》 的国家, 同意合作以减少化石能源的消耗并进而降低温室气体的排放量对包括本国在内的国际社会是有益的。 然而, 遵守这些减排义务的体系却有可能是不稳定的, 因为, 鉴于地球大气层的特殊性, 任何一个国家搭便车将会获利更大。 例如, 一国为了遵守 《京都议定书》 规定的限制二氧化碳排放的义务, 在国内设立了碳税, 这符合其国家利益。 但是, 如果该国不遵守 《京都议定书》 的规定, 不在国内采取限制化石行业的立法和措施, 它将获得更大的收益。 因为这样做的话, 它既可以减少一大笔支出, 不影响本国经济发展 (在目前的能源消费结构背景下, 减排温室气体的义务和一国经济发展在短期内是存在悖论的), 又仍然可以搭便车从其他国家努力改进的环境质量中获益。 其深层次原因在于,在世界排放总量中, 每个国家的排放量只起到一种边际作用, 而让其他国家去做减少排放的工作肯定比自己更有利, 因为这样可以节省本国减排成本。

囚徒困境说明了人类社会客观存在着的一种现象, 即个体理性并不自动地导致集体理性, 而常常导致集体非理性。 而为了维护整体利益, 就需要一种外部机制来对个体的行为进行警示、 防范和制裁。 这也是近些年一些多边环境协定竞相发展遵守机制的缘由。

(二) 猎鹿博弈

关于猎鹿博弈, 早在18世纪, 卢梭在 《论人类不平等的起源和基础》一书中就作过描述, 说明了欺骗对合作的阻碍作用。 他说:

人类就是这样于不知不觉中获得了对相互间的义务以及履行这些义务的好处的粗浅观念。 但是, 只有在目前的显而易见的利害对他们有着这样的要求的时候, 才会产生这样的观念, 因为他们毫无预见, 不用说遥远的将来, 甚至连第二天的事情都不会想到。 如果大家在捕一只鹿,每人都很知道应该忠实地守着自己的岗位。 但是如果有一只兔子从其中一人的眼前跑过, 这个人一定会毫不迟疑地去追捕这只兔子; 当他捕到了兔子以后, 他的同伴们因此而没有捕到他们的猎物这件事, 他会不大在意, 这是无须怀疑的。[6]

在猎鹿博弈中, 每个猎手都面临着以下四种策略选择:

第一, 都合作, 决不背叛, 猎到鹿后大家美餐一顿;

第二, 采用不合作手段, 在其他人猎鹿时自己去捉兔子, 使个体利益最大化;

第三, 所有人都去捉兔子;

第四, 在他人都去捉兔子时, 自己仍然坚守猎鹿的岗位。

上述四种选择中, 第一种选择对集体来说是最优策略, 合作猎到鹿后,所有个体都可以饱餐一顿免于饥饿; 第二种情况对捉兔人来说是最优策略,但其背叛行为可能会造成其他人因为猎不到鹿而挨饿; 第三种选择对集体是最坏的结果, 对个人倒不一定是最坏结果; 最后一种情况对个人和集体都不是最优选择, 从追求个人利益最大化的理性动机上, 这几乎是不可能的。 或者说, 这种选择不符合理性人的假设 (见表2)。

表2 猎鹿博弈图式

猎鹿博弈是一种合作性博弈过程, 它具有两个纳什均衡的混合战略选择。 但是, 存在合作的共同利益并不意味着双方的合作就一定能成功, 双方合作的成功取决于信息的沟通与传递。 在猎鹿博弈中, 合作各方的认识和信任最为重要。 通过信息的充分交流, 可以避免相互之间不必要的欺瞒行为,减少环境的不确定性因素, 降低博弈的机会主义倾向。

在猎鹿博弈的情形下, 即使没有强迫性的机构, 博弈双方达成的制度也能够克服集体行动失败的问题。[7]这种博弈下各个行为主体需要实现的最大利益与集体需要达到的最大利益是一致的, 两者不存在背离问题。 因此不一定需要一个强制性的中央集权机构, 来监督和强迫各个博弈方按照理想的战略行事。 这种博弈面临的问题不是对行为者的非合作行为进行惩罚或约束,而是如何通过信息的沟通与交流, 使行为者在博弈的过程中能够逐步认识到, 借助什么样的战略可以实现集体的最大化利益, 而且各个博弈方也只有在这种战略下才能够实现自己的最大化利益。 因此, 在猎鹿博弈中, 不一定非得需要强制性机构的介入, 在不断的谈判和博弈过程中, 理性的个体最终会意识到最优的战略是什么, 并遵循这种战略行事。[8]从上表中可以看出,虽然相互背叛在猎鹿博弈中也是一个纳什均衡解, 但是这个纳什均衡解不是帕累托最优的。 在不断的谈判和沟通中, 博弈方会意识到采取第一种合作的明显效益, 因此这是一个不断试验、 衡量并最终达到纳什均衡和帕累托最优的长期而艰巨的过程。(www.xing528.com)

多边环境协定的缔约国虽然数目众多, 但是各国对遵守条约的理解和行动可能由于各国实际情况的千差万别或者所考虑利益的林林总总而大相径庭。 猎鹿博弈说明, 整齐划一的遵约行为虽然也有可能出现 (那当然是最好的结果); 如果出现了个别缔约国的不遵约行为, 需要考虑其不遵约的全面、 深层信息, 再作出处理决定。 有一点值得肯定的是, 如果公共物品对于一个或一批成员国的收益大于它们为提供这种物品所付出的成本, 那么尽管其他缔约国有背叛行为, 它们也将会继续承担这种成本。 同理, 遵守机制也是一种人造的全球公共物品, 维护其运行也需要通盘考虑全体缔约国的遵约情况。

(三) 盟主博弈

囚徒困境博弈和猎鹿博弈都是假设博弈方在实力对等前提下展开的博弈。 盟主博弈不同于前两种博弈, 是在实力不对等的博弈方之间展开的。 这种情形在国际合作中非常常见, 由于国际社会中的各国在政治、 经济、 外交、 军事等方面存在差异性, 无论是合作性博弈还是非合作性博弈, 博弈方常常是在实力不对等的状况下进行博弈的。 这里所说的不对等性主要是指博弈方在权力上的差别, 它是由博弈方在相互依赖关系中的脆弱性和敏感性程度决定的。 其博弈图式如表3所示:

表3 盟主博弈图式

盟主博弈是一种典型的非对称博弈。 它的特征在于非对称性: 因为盟主比其他各方拥有更大的强制权力, 它也掌握着更多的关于自身实施强制行为潜力的信息。[9]盟主博弈的一个后果是, 合作的收益对其中一方来说是较小的甚至是不利的, 而对另一方来说则是较大的。 假设A1是大国, A2是实力相对较弱的小国, 该博弈图式的一个关键问题是, 为什么A1具有使A2必须采取合作的战略而不是背叛的战略, 尽管背叛的战略对国家A2来说收益是最大的。 国家A1为了使国家A2采用与其合作的战略, 具有两个条件:一是国家A1在使国家A2与其合作的情况下, 必须能够保证使国家A2的收益至少不小于国家A1也采取不合作战略时国家A2 (无论是合作还是不合作战略) 所能获得的收益; 二是在双方都合作的情况下, 国家A1的收益至少要大于国家A2的收益。 因此, 国家A1换取国家A2的合作, 一定程度上是以承担对国家A2利益的补偿为代价的。 另一方面, 国家A1从自身利益最大化的立场出发, 来维持这种合作关系, 这种合作关系产生的收益, 必然是国家A1的最大化利益, 这也是它愿意维持这种合作关系的理由。

绝大部分多边环境协定是在遵循各国主权平等的国际法基本原则的基础上订立的, 但是, 我们也要看到, 也有一些多边环境协定是在一个或者一些大国的倡议下开始酝酿并制定的。 更须关注的是, 某些大国对一些多边环境协定的实施和遵守有比较强的影响, 这是由这些国家的人口、 经济水平、 国家消费的资源在全球资源中的权重等因素来决定的。 我们在承认各国平等的前提下, 也不能逃避这种事实的存在。 另一方面, 一些小国可能出于自愿、被迫等心态加入或者拒绝一项多边环境协定, 或者选择遵守或不遵守条约的规定。 这些加入条约和遵守条约的不同动机, 也是多边环境协定实施面临的不确定因素。 虽然一些小国为了增加力量, 选择了团结在一起, 竭力寻求接近的立场, 以期在国际谈判和国际会议中发出更响亮的声音, 但是, 目前在国际环境问题解决上依然存在着不同国家具有不同程度的影响力的实际问题。 事实上, 只有清楚地看到了国际环境合作问题中的这种国家之间的不同, 才能制定出更具执行力的国际环境法, 也才能更好地针对各国的具体情况, 最大程度地促进多边环境协定的遵守, 达到国际环境利益的最大化。 这也是盟主博弈在国际环境问题解决中的借鉴意义之所在。

(四) 小结: 国际法律制度的遵守与博弈模式的选择

理论上讲, 为了确保合作以达到公共物品供应的目的, 一方面需要强迫性的干预力量 (制度), 以对个体的自由行动进行约束; 另一方面要通过制度设计和创新, 提供有选择性的激励, 引导个体行动走上维护或至少不损害公共利益的轨道[10]

具有强制性约束力的协议或制度, 是克服囚徒困境的一个重要方法。 在没有中央集权机构的国际社会中, 当个体的理性与集体的理性产生冲突时,理性的个体在必要的情况下必须要将自己的一部分权利让渡出来, 达成具有相互约束、 相互监督效力的国际制度, 来保证合作性的集体行动, 否则, 公共的利益就常会受到个体逐利理性的威胁。 这些具有强制实施色彩的国际制度, 是克服囚徒困境的一个最基本的工具, 尽管并非总是有效的工具。[11]

国际制度实际上是由两个方面构成的: 一是意见统一的安排或者一致同意的构成行为准则的那部分制度; 二是具有强制性约束力的作为规约的国际制度。 这两种国际制度在性质上是迥然有别的, 正如制度经济学家布罗姆利所说的: “可被看做社会行为准则的人们的偏好和行为的规律性, 与一套有体系的法律关系所产生的人们行为的规律性之间, 有着实质性的差别。”[12]

当然除了制度力量外, 某些缔约国之间共享的观念或意识形态力量也是维持特定国际条约或国际机制的重要因素。 共享的意识形态, 在很多情况下可以克服搭便车行为, 降低交易成本。 但是在本书的分析中, 我们不把观念因素或意识形态作为分析的一个变量

[1] 谢识予: 《经济博弈论》, 复旦大学出版社1997年版, 第3页。

[2] 张维迎: 《博弈论与现代经济学》, 上海三联书店、 上海人民出版社1996年版,第14页。

[3] Stephan Haggard and Beth Simmons, “Theories of International Regimes”, Interna-tional Organization,1987,No.3, Vol.41,p.306.

[4] 姚海鑫: 《经济政策的博弈论分析》, 经济管理出版社2001年版, 第32~35页。

[5] 黄淳、 何伟: 《信息经济学》, 经济科学出版社1998年版, 第187页。

[6] [法] 让·雅克·卢梭: 《论人类不平等的起源和基础》, 李常山译, 商务印书馆1962年版, 第114~115页。

[7] Todd Sandler,Collective Action:Theory and Applications,New York:Basil Blackwell, 1987, p.42.

[8] Iain Mclean,Public Choice:An Introduction,New York:Basil Blackwell,pp.14-16.

[9] 参见爱格特森: 《新制度经济学》, 商务印书馆1996年版, 第276页。

[10] 参见奥尔森: 《集体行动的逻辑》, 陈郁等译, 上海三联书店、 上海人民出版社1996年版, 第41~42页。

[11] 这里所说的强制性力量并不必然等同于中央集权机构, 尽管我们承认中央集权机构对克服囚徒困境下公共物品供应不足的问题可能是一个好办法。 在国际社会中不存在中央集权机构, 但是这并不等于说, 国际社会中存在的囚徒困境问题就无法解决。 通过适当的制度安排, 国际公共物品供应不足的问题是可以克服或者缓解的。

[12] 布罗姆利: 《经济利益与经济制度——公共政策的理论基础》, 商务印书馆1997年版, 第121页。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈