首页 理论教育 植入第三方参与者的互惠模型刻画

植入第三方参与者的互惠模型刻画

时间:2026-01-22 理论教育 可欣 版权反馈
【摘要】:现在引入公平的第三方参与者0,令参与者0的策略为θ,并假定此行为策略所有参与者的公共知识。第三方参与者0的引入在某种情况下可以消除劳动关系中的消极互惠行为,从而促使合作博弈结果的形成。

首先对Dufwenberg和Kirchsteiger(2004)提出的互惠效用函数进行描述。考虑多人博弈的情形,假设参与者的集合N={1,2,…,N}。用Ai表示参与者i(i∈N)的策略集,Bij为参与者i关于参与者j策略的信念集,Bij=Aj,i,j∈N;Cijk=Bik=Ak为参与者i关于参与者j关于参与者k策略的信念的信念集,i,j,k∈N,j≠k。于是,bij∈Bij表示参与者i关于参与者j策略的信念(一阶信念),而ciji∈Cijk是参与者i所认为的参与者j关于参与者i策略的信念的信念(二阶信念)。

参与者i具有互惠动机,其支付可表示为:

图示

(7.1)式中,πi(ai,bij)代表参与者i得到的物质收益。图示·κij(ai,bij)·λiji(bij,ciji)则表示参与者i因互惠动机而得到的心理收益:参与者i关于参与者j的互惠敏感度为Yij>0;参与者i对参与者j的善意程度为κij(ai,bij);参与者i感知到的参与者j对于自己的善意程度(二阶信念)为λiji(bij,ciji)。按照互惠的定义,当κij>0时,λiji>0,即若参与者i认为对方对自己是友善的,则自己也会善意对待对方,反之亦然。

参与者i对参与者j的善意程度κij(ai,bij)进一步可描述为:

图示

其中:

图示

图示(bij)是参与者j关于参与者i的公平支付,为给定参与者j的策略bij,参与者i的策略ai给参与者j带来的最大收益与最小收益的平均值。这样,参与者i对参与者j的善意程度κij(ai,bij)就是参与者i的策略为参与者j带来的收益与参与者i可以给参与者j带来的平均收益的差值。

参与者i对于参与者j对自己善意程度的推断λiji(bij,ciji)定义为:

图示

图示 (ciji)是参与者i关于参与者j的公平支付,被描述为:给定参与者i对于参与者所认为的参与者j关于参与者i策略的信念,参与者i所感知的参与者j的策略bij给参与者i带来的最大收益与最小收益的平均值,这样λiji(bij,ciji)就可理解为参与者i感知到的参与者j的策略给参与者i带来的收益与参与者j能够给参与者i带来的平均收益的差值。最后,Dufwenberg和Kirchsteiger(2004)刻画了“连续互惠均衡”(SRE)的概念,并对SRE的存在性进行了证明。

现在引入公平的第三方参与者0,令参与者0的策略为θ,并假定此行为策略所有参与者的公共知识。此时,参与者集合变为N={0,1,2,…,N}。值得一提的是,在Dufwenberg和Kirchsteiger(2004)的模型中,信念会随着博弈的进行而更新,但关于参与者0策略的信念不会随着博弈的进行而更新,参与者可以观测到参与者0的策略的实现,但他们不会更新他们关于参与者0的策略的信念,也不会更新他们关于其他参与者关于参与者0的策略的信念的信念。

给定上述假定,并且参照Dufwenberg和Kirchsteiger(2004)的做法,可以得到植入第三方参与者0时,参与者i的效用函数:(https://www.xing528.com)

图示

由于增加了第三方参与者0及其为共同知识的策略θ,故此时对参与者i效用函数中的两部分物质支付与心理支付的定义,与Dufwenberg和Kirchsteiger(2004)的模型相比发生了变化。另外,参与者0的引入将导致参与者i的期望公平支付发生改变;根据Dufwenberg和Kirchsteiger(2004)的思路,参与者i关于参与者j的公平支付被刻画为参与者j能够给参与者i带来的平均收益,而在本书中,参与者0不与任何其他参与者发生利益关系,并且能为各方所接受,因此可将由参与者0开始的子博弈所导致的期望物质支付组合看成新的公平支付组合集。基于此,参与者i对参与者j的善意程度κij(ai,bij,θ)被刻画为:

图示

此时新的公平支付图示只与参与者0的策略有关,而与信念bij无关,因为由参与者0开始的子博弈可以看成一个标准博弈过程,而新的公平支付则可以看作一个标准博弈的物质支付,与心理博弈过程无关,因此,新的公平支付只与参与者0的客观策略有关,与信念无关。

同样,与之类似,参与者i所感知到的参与者j的善意为λiji(bij,ciji,θ)=π(bij,ciji,θ)-图示(θ)。

(2)消极互惠行为的改变。

第三方参与者0的引入在某种情况下可以消除劳动关系中的消极互惠行为,从而促使合作博弈结果的形成。为了看清这一点,通过一个简单的例子来说明。考虑博弈T1(见图7.1)。

图示

图7.1 博弈T1

博弈T1是依据Nalebuff和Shubik(1988)构造的三人博弈的修改。首先,参与者1必须决定参与者2与参与者3中的哪一个获得支付0;然后,这个获得支付0的参与者再决定4美元在另外两个参与者中如何分配。直觉告诉我们,当参与者2与3具有足够大的互惠参数时,由于受到参与者1“不善意”对待,他们会对参与者1进行报复,此时,参与者1将获得最低的支付水平1。假定参与者2与3的报复要付出一个ξ>0的成本。也就是说,在博弈T1中,当参与者2与3具有足够大的互惠参数时,参与者1将成为最“糟糕”的参与者,因为此时,参与者2与3的期望支付接近1.5(ξ足够小时),而参与者1的期望支付只有1。

下面对博弈T1进行修改,引入参与者0,并构造博弈T2(见图7.2)。

在博弈T2中,参与者1通过公开性的“抛硬币”的方式来决定其余两个参与者中谁得到支付0,程序M即表示“抛硬币”,而参与者N则为引入的虚拟的第三方参与者,其行为策略为(L(0.5),R(0.5)),即L与R出现的概率皆为0.5,而且N的策略空间为所有参与者的公共知识。更重要的是,所有参与者都接受参与者N的行为策略所导致的结果,并视这一结果为新的公平支付基准。因此,参与者1选择程序M时,其他参与者认为参与者1的善意为零,此时参与者2与参与者3没有报复参与者1的动机,所以,当参与者1选择程序M时,参与者2与参与者3的均衡选择为(l,l),这使得参与者1的期望收入为3,并且此时,参与者所接受的公平支付基准为参与者1、2、3分别获得3、0.5、0.5的预期收益。可以发现,参与者1通过选择程序M,规避了参与者2与3的消极互惠偏好,提高了自己的期望支付水平。

图示

图7.2 博弈T2

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈