政府购买体育公共服务的利益博弈模型研究

时间：2026-01-26 理论教育小可爱版权反馈

【摘要】：博弈的分类根据不同的基准也有不同的分类。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。纳什均衡的经典案例案例一：囚徒困境在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”博弈模型。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。表2-1囚徒困境博弈对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。

博弈的分类根据不同的基准也有不同的分类。

一般认为，博弈主要可以分为合作博弈和非合作博弈。合作博弈和非合作博弈的区别在于相互发生作用的当事人之间有没有一个具有约束力的协议，如果有，就是合作博弈，如果没有，就是非合作博弈。从行为的时间序列性，博弈论进一步分为静态博弈、动态博弈两类：静态博弈是指在博弈中，参与人同时选择或虽非同时选择但后行动者并不知道先行动者采取了什么具体行动；动态博弈是指在博弈中，参与人的行动有先后顺序，且后行动者能够观察到先行动者所选择的行动。“囚徒困境”就是同时决策的，属于静态博弈；而棋牌类游戏等决策或行动有先后次序的，属于动态博弈。

按照参与人对其他参与人的了解程度分为完全信息博弈和不完全信息博弈。完全博弈是指在博弈过程中，每一位参与人对其他参与人的特征、策略空间及收益函数有准确的信息。不完全信息博弈是指如果参与人对其他参与人的特征、策略空间及收益函数信息了解得不够准确，或者不是对所有参与人的特征、策略空间及收益函数都有准确的信息，在这种情况下进行的博弈就是不完全信息博弈。

经济学家们所谈的博弈论一般是指非合作博弈，由于合作博弈论比非合作博弈论复杂，在理论上的成熟度远远不如非合作博弈论。非合作博弈又分为：完全信息静态博弈，完全信息动态博弈，不完全信息静态博弈，不完全信息动态博弈。与上述四种博弈相对应的均衡概念为：纳什均衡，子博弈精炼纳什均衡，贝叶斯纳什均衡，精炼贝叶斯均衡。博弈论还有很多分类，比如：以博弈进行的次数或者持续长短可以分为有限博弈和无限博弈；以表现形式也可以分为一般型（战略型）或者展开型；以博弈的逻辑基础不同又可以分为传统博弈和演化博弈（朱·弗登博格，让·梯若尔，2010）。

（1）纳什均衡

纳什均衡是在一策略组合中，所有的参与者面临这样一种情况，当其他人不改变策略时，他此时的策略是最好的。也就是说，此时如果他改变策略，他的支付将会降低。在纳什均衡点上，每一个理性的参与者都不会有单独改变策略的冲动。纳什均衡点存在性证明的前提是“博弈均衡偶”概念的提出。所谓“均衡偶”是在二人零和博弈中，当局中人A采取其最优策略a*，局中人B也采取其最优策略b*，如果局中人仍采取b*，而局中人A却采取另一种策略a，那么局中人A的支付不会超过他采取原来的策略a*的支付。这一结果对局中人B亦是如此。

这样，“均衡偶”的明确定义为：一对策略a*（属于策略集A）和策略b*（属于策略集B）称之为均衡偶，对任一策略a（属于策略集A）和策略b（属于策略集B），总有：偶对（a，b*）≤偶对（a*，b*）≥偶对（a*，b）。

对于非零和博弈也有如下定义：一对策略a*（属于策略集A）和策略b*（属于策略集B）称为非零和博弈的均衡偶，对任一策略a（属于策略集A）和策略b（属于策略集B），总有：对局中人A的偶对（a，b*）≤偶对（a*，b*）；对局中人B的偶对（a*，b）≤偶对（a*，b*）。

有了上述定义，就立即得到纳什定理：任何具有有限纯策略的二人博弈至少有一个均衡偶。这一均衡偶就称为纳什均衡点。

纳什定理的严格证明要用到不动点理论，不动点理论是经济均衡研究的主要工具。通俗地说，寻找均衡点的存在性等价于找到博弈的不动点。纳什均衡点概念提供了一种非常重要的分析手段，使博弈论研究可以在一个博弈结构里寻找比较有意义的结果。但纳什均衡点定义只局限于任何局中人不想单方面变换策略，而忽视了其他局中人改变策略的可能性，因此，在很多情况下，纳什均衡点的结论缺乏说服力，研究者们形象地称之为“天真可爱的纳什均衡点”。

（2）纳什均衡的经典案例

案例一：囚徒困境

在博弈论中，含有占优战略均衡的一个著名例子是由塔克给出的“囚徒困境”博弈模型。该模型用一种特别的方式为我们讲述了一个警察与小偷的故事。假设有两个小偷A和B联合犯事、私入民宅被警察抓住。

警方将两人分别置于不同的两个房间内进行审讯，对每一个犯罪嫌疑人，警方给出的政策是：如果两个犯罪嫌疑人都坦白了罪行，交出了赃物，于是证据确凿，两人都被判有罪，各被判刑8年；如果只有一个犯罪嫌疑人坦白，另一个人没有坦白而是抵赖，则以妨碍公务罪（因已有证据表明其有罪）再加刑2年，而坦白者有功被减刑8年，立即释放。如果两人都抵赖，则警方因证据不足不能判两人的偷窃罪，但可以私入民宅的罪名将两人各判入狱1年。下表给出了这个博弈的支付矩阵（见表2-1）。

表2-1　囚徒困境博弈

对A来说，尽管他不知道B作何选择，但他知道无论B选择什么，他选择“坦白”总是最优的。显然，根据对称性，B也会选择“坦白”，结果是两人都被判刑8年。但是，倘若他们都选择“抵赖”，每人只被判刑1年。在表2-1中的四种行动选择组合中，（抵赖，抵赖）是帕累托最优，因为偏离这个行动选择组合的任何其他行动选择组合都至少会使一个人的境况变差。但是，“坦白”是任一犯罪嫌疑人的占优战略，而（坦白，坦白）是一个占优战略均衡，即纳什均衡。不难看出，此处纳什均衡与帕累托存在冲突。

单从数学角度讲，这个理论是合理的，也就是选择都坦白。但在这样多维信息共同作用的社会学领域显然是不合适的。正如中国古代将官员之间的行贿受贿称为“陋规”而不是想方设法清查，这是因为社会体系给人行为的束缚作用迫使人的决策发生改变。比如，从心理学角度讲，选择坦白的成本会更大，一方坦白害得另一方加罪，那么事后的报复行为以及在周围知情人当中的“出卖”角色将会使他损失更多。(https://www.xing528.com)

我们正处于大数据时代，想更接近事实的处理一件事就要尽可能多地掌握相关资料并合理加权分析，人的活动影响动因复杂，所以囚徒困境只能作为简化模型参考，具体决策还得具体分析。

案例二：智猪博弈

经济学中的“智猪博弈”，这个例子讲的是：假设猪圈里有一头大猪、一头小猪。猪圈的一头有猪食槽，另一头安装着控制猪食供应的按钮，按一下按钮会有10个单位的猪食进槽，但是谁按按钮就会首先付出2个单位的成本，若大猪先到槽边，大小猪吃到食物的收益比是6∶4；同时到槽边，大小猪收益比是7∶3；小猪先到槽边，大小猪收益比是9∶1。那么，在两头猪都有智慧的前提下，最终结果是小猪选择等待。

“智猪博弈”由纳什于1950年提出。实际上小猪选择等待，让大猪去按控制按钮，而自己选择“坐船”（或称为搭便车）的原因很简单：在大猪选择行动的前提下，小猪选择等待的话，小猪可得到4个单位的纯收益，而小猪行动的话，则仅仅可以获得大猪吃剩的1个单位的纯收益，所以等待优于行动；在大猪选择等待的前提下，小猪如果行动的话，小猪的收入将不抵成本，纯收益为-1单位，如果小猪也选择等待的话，那么小猪的收益为零，成本也为零，总之，等待还是要优于行动。用博弈论中的报酬矩阵可以更清晰地刻画出小猪的选择（见表2-2）：

表2-2　智猪博弈的支付矩阵

从矩阵中可以看出，当大猪选择行动的时候，小猪如果行动，其收益是1，而小猪等待的话，收益是4，所以小猪选择等待；当大猪选择等待的时候，小猪如果行动的话，其收益是-1，而小猪等待的话，收益是0，所以小猪也选择等待。综合来看，无论大猪是选择行动还是等待，小猪的选择都将是等待，即等待是小猪的占优策略。

在小企业经营中，学会如何“搭便车”是一个精明的职业经理人最为基本的素质。在某些时候，如果能够注意等待，让其他大的企业首先开发市场，是一种明智的选择。这时候有所不为才能有所为！高明的管理者善于利用各种有利的条件来为自己服务。“搭便车”实际上是提供给职业经理人面对每一项花费的另一种选择，对它的留意和研究可以给企业节省很多不必要的费用，从而使企业的管理和发展走上一个新的台阶。这种现象在经济生活中十分常见，却很少为小企业的经理人所熟识。在智猪博弈中，虽然小猪的“捡现成”的行为从道义上来讲令人不齿，但是博弈策略的主要目的正是使用谋略最大化自己的利益。

案例三：美女的硬币

一位陌生美女主动过来和你搭讪，并要求和你一起玩个游戏。美女提议：“让我们各自亮出硬币的一面，或正或反。如果我们都是正面，那么我给你3元，如果我们都是反面，我给你1元，剩下的情况你给我2元就可以了。”听起来是不错的提议。如果我是男性，无论如何我是要玩的，不过从经济学考虑就是另外一回事了，这个游戏真的够公平吗？该博弈的支付矩阵见表2-3。

表2-3　美女硬币的博弈支付矩阵

假设我们出正面的概率是x，反面的概率是1-x。为了使利益最大化，应该在对手出正面或反面的时候我们的收益都相等，不然对手总是可以改变正反面出现的概率让我们的总收入减少，由此列出方程就是3x+（-2）*（1-x）=（-2）*x+1*（1-x）。这个方程通俗地说就是在对手一直出正面你得到的利益，和你对手一直出反面得到利益是一样的且最大。解方程得x=3/8，也就是说平均每八次出示3次正面，5次反面是我们的最优策略。而将x=3/8代入到收益表达式3*x+（-2）*（1-x）中就可得到每次的期望收入，计算结果是-1/8元。

同样，设美女出正面的概率是y，反面的概率是1-y，列方程-3y+2（1-y）=2y+（-1）*（1-y）。解得y也等于3/8，而美女每次的期望收益则是2（1-y）-3y=1/8元。这告诉我们，在双方都采取最优策略的情况下，平均每次美女赢1/8元。其实只要美女采取了（3/8，5/8）这个方案，不论你再采用什么方案，都是不能改变局面的。如果全部出正面，每次的期望收益是（3+3+3-2-2-2-2-2）/8=-1/8元

如果全部出反面，每次的期望收益也是（-2-2-2+1+1+1+1+1）/8=-1/8元。而任何策略无非只是上面两种策略的线性组合，所以期望还是-1/8元。但是当你也采用最佳策略时，至少可以保证自己输得最少。否则，你肯定就会被美女采用的策略针对，从而赔掉更多。看起来这个博弈模型似乎没有什么用处，但是其实这可能牵涉金融市场定价中最重要的一个模型：定价权重模型了。

总的来说“博弈论”其本质是将日常生活中的竞争矛盾以游戏的形式表现出来，并使用数学和逻辑学的方法来分析事物的运作规律。既然有游戏的参与者那么也必然存在游戏规则的制定者。深入的了解竞争行为的本质，有助于我们分析和掌握竞争中事物之间的关系，更方便我们对规则进行制定和调整，使其最终按照我们所预期的目的进行运作。

免责声明：以上内容源自网络，版权归原作者所有，如有侵犯您的原创版权请告知，我们将尽快删除相关内容。

我要反馈

工作计划

年度工作

工作规划

教学计划

实施方案

工作方案

教学工作

发展计划

德育工作

管理工作

发展规划

工作总结

教育工作

体育教师

年度计划

后勤工作

安全教育

工作思路

教育计划

小学教师

幼儿教师

数学教师

食品安全

英语教学

政府购买体育公共服务的利益博弈模型研究

相关推荐

政府购买体育公共服务的利益博弈模型研究

相关文章：

相关推荐