首页 理论教育 科技政策研究:博弈分析与成果

科技政策研究:博弈分析与成果

时间:2023-11-30 理论教育 版权反馈
【摘要】:民主政治体制下的国家级科技政策,其决策选择俨然已是现代产业政策制定中的核心要素。科技政策;决策选择;博弈论;逆向选择;动态均衡公共政策制定的优劣会影响到政策执行的结果,因而政策制定理应是公共政策研究领域中的重要议题。所谓决策选择指的是贯穿于政策行动方案制定的整个过程和各个层次中的各种决断与作为。首先,在科技政策制定过程中,因为利益团体有其利益需求与目的,与官方决策者构成博弈关系。

科技政策研究:博弈分析与成果

光相中

南开大学周恩来政府管理学院,天津 300071)

【摘 要】产业政策是公共政策与公共管理领域下的一个重要和典型环节,科技政策是现代化国家产业政策的主要组成部分,其影响层面涵盖了社会经济政治民生、生态环境,甚至是国家安全等。民主政治体制下的国家级科技政策,其决策选择俨然已是现代产业政策制定中的核心要素。文章引入“委托-代理理论”、信息经济学中的“逆向选择”与博弈论中“动态均衡”的槪念。基于博弈的视角,探讨科技政策在制定过程中主要政策主体间的相互影响力,从宏观角度整体分析了官方决策者、利益团体以及科技专家的不同抉择对政策走向的影响。进而从行为规范与管控制度两方面提出相应建议,以便找出有效的决策选择。

关键词】科技政策;决策选择;博弈论;逆向选择;动态均衡

公共政策制定的优劣会影响到政策执行的结果,因而政策制定理应是公共政策研究领域中的重要议题。“在公共政策主体的分类上,存在着官方决策者和非官方参与者、体制内和体制外等划分方式。”[1]68文章着重于科技政策制定过程中主要政策主体间在决策选择上的博弈关系。所谓决策选择指的是贯穿于政策行动方案制定的整个过程和各个层次中的各种决断与作为。主要政策主体是以中央政府为核心的官方决策者,与之相应的分别是经济性利益团体和科技专家为主的非官方参与者。官方决策者专指握有决定权且以政治与权力为载体的政府官员,非官方参与者则指影响层面大且与官方决策者互动较为密切的经济性利益团体与科技专家。经济性利益团体(以下简称利益团体)指的是本身独立或结合其他组织联合行动,以谋取经济上私有利益为目标的团体;科技专家在此是指拥有科技专业知识与技术,且有能力影响其他参与决策者的人。其他非官方参与者如公众、社会组织和媒体等,本文暂不涉及讨论。

政策主体在科技政策的决策选择上的博弈行为必须从关系特征上分析,进而梳理出理论框架,具体体现如下。

1)博弈关系分析

对于国家级科技政策,其政策主体间博弈关系是指,首先由科技专家提供知识与技术咨询,官方决策者参考专家建议,并从政治与权力观点上提出个人意见,规划出政策的方向与规则;而后再经代表公共利益的公众或社会组织(如:社会福利组织、环境保护团体等)及代表私有利益的利益团体(如:商会协会、产业联盟、企业、企业家联盟等),在公开或非公开情况下大量地搜集各方意见,多方经过多次辩论与反复的修正、验证等过程后取得最大化共识。同时,因为 “决策规则的改变很可能导致结果的变化”[2]127,从政治层面而言,此种变化影响之巨不可不察,一定要清楚制定决策规则并切实遵循,再经由议程设定、政策规划、立法等程序步骤,形成国家科技政策。

作者简介:光相中 南开大学周恩来政府管理学院博士在读,研究方向:公共组织与管理

另外,非官方参与者的外在影响力也不得轻视,“非官方行动者会影响甚至有时候会决定官方行动者对政策的决策与制定活动”[3]52。除科技专家外,还有媒体、公众舆论等。文章基于博弈视域考虑,在非官方参与者方面,仅针对利益团体及科技专家两者分别与官方决策者之间的意向性博弈行为予以探究。

2)理论框架论述

基于博弈论(game theory)的政策分析的主要目的在于找出均衡状态,对政策后果进行预测或对政策进行优化。博弈论是指研究一对一或一对多方在对抗竞争态势下的方法和理论,其主要机理是目标或利益有所冲突甚至相反的各方在一定的游戏规则下行动,且依据他方的策略和手段设计出己方最佳的对抗策略,以使己方在对抗中处于优势。

首先,在科技政策制定过程中,因为利益团体有其利益需求与目的,与官方决策者构成博弈关系。此时的利益团体是委托方,官方决策者是代理方,进而促成交易行为的发生。委托-代理理论 (p rincipalagent theory)作为双方关系的宏观理论背景及支撑,可被运用在政策制定过程中进行委托-代理困境分析。但由于政策制定过程有一定复杂性,仅以委托-代理理论进行基本框架的论述与分析时有明显不足。鉴于此,导入信息经济学的逆向选择(adverse selection)作为中层理论 (theories of the m idd le range),建构出基本的分析工具。诚然,政策在制定的过程中,因双方所处地位、信息来源渠道与信息量的不同会产生时间、内容或知识上的信息不对称,并且极可能形成代理方拥有充分信息,委托方却因缺乏信息而降低博弈意愿甚至退出,演变成实质不对称的窘态。显而易见,官方决策者与利益团体之间的博弈行为,具备逆向选择理论的完整基本要素,即交易发生、信息不对称与委托-代理关系。因此,逆向选择理论有充分的条件作为官方决策者与利益团体之间博弈关系的基本分析工具。

其次,基于有限理性假设,还需要为官方决策者与科技专家间的博弈行为决定一个可行的分析工具。依经济学原理解释,动态均衡(dynam ic equilibrium)是指经济系统的各种变量随时间变化所处的均衡状态。在此引申为某时间条件下,政策过程本身动态性地被解释、讨论与修正,从而趋于均衡或稳定的状态。而政策动态均衡是指“政策在时间维度中因各影响因素的组合和相应的力量变动从而使得政策的态势不断发生变化 (尤其是政策参与者之间的相互利益格局的时间变动),使得政策结构从稳定到不稳定,然后再到稳定转换,最终实现长期意义的稳定状态。”[4]20据此,从政策制定过程的时间变化与政治氛围角度下检视对应的以官方决策者为载体的政治生态与权力背景和以科技专家为载体的个人知识与技术偏好,动态均衡不失为探讨两者相互关系的理想分析工具。

国家级科技政策的政策主体中,官方决策者和非官方参与者,即政府官员和经济性利益团体,双方各有其立场与价值追求。詹姆斯·麦迪逊是公认的最早研究利益集团问题的重量级美国理论家,他笔下的“派别”就是所谓的利益集团,是指“部分公民,无论在全体中属于多数还是少数,在共同的欲望或利益的推动下联合行动,但却与其他公民的权利或这个社会的长远与整体利益背道而驰。”[5]13无论非官方参与者如何费尽心思游说官方决策者以期政策偏袒己方,但在双方立场不同与信息取得不对称的情况下,各自的博弈策略自然有所不同,逆向选择即在此环境下应运而生。与此同时,彼此自然形成“激励不相(兼)容”的现象,这是指官方决策者和非官方参与者在追求自身利益最大化下,其行为会按自身利益的方向行动,且在追求利益的行为上,无法与最终的集体价值最大化目标吻合。

综上而言,官方决策者和非官方参与者无论个别或双方互动间均具备独立性特质、强制性政策、信息不对称与激励不兼容等基本条件,足以构建博弈行为模式,下表说明双方博弈策略。

表1 官方决策者和非官方参与者间决策博弈策略模型

官方决策者和利益团体间激励不兼容,且在两者均无违反道德规范假设前提下,此类型的博弈视双方是否达成协议或交易而论,属于典型的非合作博弈,其具体分析如下。

首先,从政策制定过程的视角来界定官方决策者和利益团体间博弈的关联性。倾向公益政策指官方决策者制定的政策,方针、内容或办法以公众利益为主。反之,偏袒私益政策即官方决策者在有限理性下向利益团体倾斜。

假设表1博弈矩阵中,政府官员的“倾向公益”为积极策略,“偏袒私益”为消极策略;那么利益团体选择“配合”为积极策略,“不配合”为消极策略。若官员选择“倾向公益”而利益团体选择“配合”,即双方均选择积极策略,则双方收益为(3,0),此时利益团体虽选择配合但无特别收益影响不大;若官员选择“偏袒私益”而利益团体选择“不配合”,即双方均选择消极策略,则官方会损失社会成本,利益团体除游说成本外,还要加上因其他组织的迎合政策而获利从而导致其收入减少的受损,此时收益为(-3,-4)。由此可知,官员的最佳策略应是选择“倾向公益”,且利益团体选择“配合”,收益为(3,0),即官方决策者与利益团体都采取积极策略。其结果是官方决策者取得3个单位的点数,而利益团体因无法在政策上获利而没取得点数。至于利益团体的最佳策略,应是在官员选择“偏袒私益”的情况下选择“配合”,收益为(-3,2),即官方决策者策略上消极而利益团体策略上积极,其结果是官方决策者付出社会成本,利益团体则在扣除1个单位的游说成本后取得2个单位的点数。

上述博弈矩阵中双方形成的最佳策略即为 “纳什均衡”(Nash equilibrium)。就利益团体而言,配合公众利益政策不会有所损失,反之不配合则可能因为其他组织或团体选择配合,而影响收入造成损失,即收益为(3,-2);另一方面,若面对“偏袒私益”政策选择配合策略,虽有额外成本的发生但最终毕竟可以获益。因此,利益团体纷纷就自身需求与目的,投入大量资金进行政府游说工作,博弈结果落入“囚徒困境”(Prisoners’dilemma)的冻结(Freezing)状态,导致政策制定主体的逆向选择,形成政治乱象。

事实上,就算是官方决策者推出符合公众利益的政策,利益团体也绝不会自断其路,而会朝着与自身利益接近的方向调整其策略。与此同时,其他相关利益团体或组织也会主动去适应新法令与办法,以降低或规避对自己不利的约束,进而追求现况下收益最大化。从另一角度来看,也意味着不同利益目标的团体或组织,在追求集体理性利益最大化下,突破纳什均衡的困境,即在不可能再改善该利益团体的境况下,不使任何公众利益受损,最终达到各方的最优均衡。

美国学者斯库勒 (Schooler Dean Jr.,1971)曾提出科学家会引导政策的产生或改变已有政策,意味着科技专家有能力凭借其知识与技术影响其他决策参与者的思维,产生决策或改变原有决策方向与结果,进而牵动整体的科技政策,因而对科技专家影响层面的广度与深度绝不可小觑。官方决策者与科技专家在国家级科技政策制定过程中互相之间的关系非常微妙。官方决策者是握有权力的政府官员,但也可能同时具备完整的科技背景、宏观的科技产业信息、丰富的管理实务以及成熟的组织产业化项目的经验,如果官方决策者就其个人意识行为而左右他人的抉择,那么福萊伯傑格·班特 (Flyvb jerg Bent)的箴言就非常值得重视:“权力越大,理性越少(The greater the power,the less the rationality)”[6]229,或者可说成是看领导办事,如此一来科技专家的咨询与建议意义相对不大,且有可能会造成对政策不利的影响。反之,若官方决策者不具科技背景,而过分仰赖科技专家,是否会受专家有限的个人知识与技术偏好的影响,而在决策选择上有所偏颇?此时的科技专家又是否会因此恃宠而骄的操纵决策选择?或因为 “利益冲突的增加对科技专家作用的发挥起到负面作用”[7]167而偏离了技术论证,产生相反效果,形成官员与专家在决策选择上的对峙或抗衡。这种对峙或抗衡的存在,驱使决策的进行一定需要遵循某种机制,否则在缺乏共识的状态下,可能延误决定或做出不明智的决策选择,对政策会有非常不利的影响。

诚然如此,还有另一股不可忽视的力量,即政治环境。尽管官员与专家双方针对政策内涵取得共识,但依当时的政治环境下的生态与氛围,也极有可能变更共识而影响最终结果。其次,时间维度还会影响组合因素和相对应的力度,使得政策变化在一定时期内处于不稳定状态。延伸到各方利益的角力上,时间的变动较难掌控,但政策的整体结构会从稳定到不稳定,然后再转换到稳定,最终趋于稳定,形成完美的动态均衡模式,并且嵌入非合作博弈到合作博弈的过渡纽带。据此,“纳什谈判解”(Nash bargaining solution)实为构建双方博弈行为模式的理想分析工具,如图1所示。

图1 官方决策者与科技专家间政策博弈策略模式

(参考来源:巫和懋、夏珍,台北:时报文化出版社,《赛局高手:全方位策略与应用》,2002年)

选择纳什谈判解,重点在于找出官方决策者与科技专家在“合意”情形下的所有可能分配方式,那就是效率前缘曲线E。所谓“合意”,指官方决策者与科技专家双方意见相符而取得一致性的共识,并做出决策选择。当双方达成最大共识时,结果会落在效率前缘曲线E的最大值N点即均衡点上,代表双方博弈策略处于稳定状态;而当超越威胁点D(d1,d2)即双方各自的条件底线时,代表双方无法就一定的政策理念达成合意,若是在威胁点以上的范围则表示双方能在某种条件下各自让步或妥协,达成共识,最终的博弈解将会落于N点或集中在N点附近。

无论如何,在此效率前缘曲线E以外,可能会有无数条效率前缘曲线的发生。同时也会产生落在这些曲线上相对应的均衡点。其意味着官方决策者与科技专家达成各项合意,并均衡处在发展程序模式,且依时间脚步逐一形成后,再相连成一轨迹线,即为导向线F,此线代表时间维度。且在不同时间下,一个政策的制定从双方历经一次或数次博弈行为产生的合意,其结构也会从稳定到不稳定、再稳定、直到长期的稳定为止。此时,在每个决策选择均达合意的情况下,政策本身发展趋于均衡,且双方皆处于满意状态,在短期内也不至于会想要去改变。但是,若时间造成均衡条件变化,那么下一轮的动态均衡运动又会相继展开。

决策选择指的是政策制定行动方案过程中的各种决断与作为,亦是政策制定成败的关键要素之一。基于前文分析得知,道德操守、经济利益与政治环境是影响决策博弈行为的根本因素。据此,从行为规范与管控制度两方面提出相应之策。

4.1 行为规范的树立

在“利”字当头的现今社会里,贪婪是人性的最大弱点,往往因为利益诱惑而违反行为准则和道德规范。将道德操守束之高阁,就算有良好的管控流程与机制,也不能完全杜绝弊端和问题的发生。因此,如何有效引导官方决策者与非官方参与者秉持正确的价值观念,遵守自律规范,重点监督道德行为就成为了首要工作。

科技政策在制定过程中,所有参与者的道德操守和行为标准,必须先在价值观念的优先性和规范性问题上确定判断准则,为“规范性假定”(Normative presumption)奠定良好基础,再判定是否能巩固此价值观念,才能做好接续的重要工作。由于在不同的社会环境与政治氛围下,价值观念也会有不同假定性上的偏好组合,因此所有参与者在咨询与建议、争取权益之外,还应进行民意与社会舆论调查,通过座谈、公开研讨会等形式让公众意见充分及时地反映在决策中。

其次,在此阶段必须特别重视所有参与者决策行为上的故意操作,无论参与者在个人还是团体意识形态下,都会为谋求自身利益而刻意在政策制定过程中影响决策选择,进而导致政策制定受阻以达其目的。针对此问题,首要之务就是强化良好社会价值观的重要性,使参与者以道德操守作为行为规范的主轴。对所有参与者应加强倡导以服务群众为出发点,以为人民追求幸福生活社会进步为依归的中心理念。

此外,个人的道德操守非常不容易查核,除非进行深入的生活模式追踪调查,否则很难察觉。因此,执行办法上应提高道德标准并加重罚责,清楚强调对任何违反规范的参与者会予以重处,以达警戒之效,防范于未然。

4.2 管控制度的建立

公共政策的完整过程一定是从问题确定、议程设定、制定政策、政策合法化、政策执行及后续步骤直到终结,无论政策是否能满意地解决问题或不满意的周而复始持续进行,制定公共政策一定都会经由确定政策议题、政策规划、论证评核、政策修正、与选择政策等细节逐一实施。诚然,政策内容的优劣会反映到未来执行成效上,而内容本身的公平合理性、明确清晰性、宏观协调性又与制定过程的良莠息息相关,且足以牵动施政效果。经济学者张曙光曾提到 “制度实施的不完全还来自于制度本身的不完善”[8]139。因此,必须藉由政策制定过程的管理与控制系统,预防和遏阻问题的发生,强化国家重大科技产业发展的宏观布局,并在社会价值配置最大化下,采取积极措施消解博弈困境,统筹兼顾各方利益,提升政府资源的使用效率,促使政策形成合力。在该项制度下建立一个综合性决策体制实属必要,具体体现在决策立项机制、权责分配与利益回避机制、信息沟通机制、多层次决策管理机制、以及监督与绩效评核机制等方面。(www.xing528.com)

4.2.1 决策立项机制

决策立项是管控制度建立的首要工作,也是决策选择发生的前导指标。国家级科技政策牵涉面大,如有疏忽很可能会造成无法弥补的损失,导致国家资源浪费和国际竞争力的降低,故须设定筛选原则并建立有效机制,其需有如下特性:

1)择优性:订定明确立项标准,筛选优质项目投入。科技政策应以国家总体目标发展为依归,在有限资源条件下,配合国家产业发展纲领,选择质优且适合国情的科技产业进行投入,并坚持有所为有所不为的原则,避免错误的发生。

2)主导性:主导性泛指要选择有助于国家进歩,同时在领域内具有前瞻引领特质的关键科技项目。这类科技项目本身占据专业领域内主导地位,且未来足以构建完整的上、中、下游产业链,支撑产业的延伸与发展。

3)创新性:科技创新价值,指在科学技术要素全新组合下所产生的价值。国家与企业双方对科技创新行为目标和价值的衡量有一定差距,为排除立项的低效或失效,在总体目标框架引导下,政府应倾向适合公众利益的科技创新进行资源分配,整合出符合相对均衡的决策项目。

4)协调性:为避免所有参与者因考虑自身利益而有所偏袒,从宏观协调角度促使立项以总体利益为立足点,排除中央与地方、主体与主体间的利益冲突,理顺相互矛盾,博弈行为中各方利益最终朝均衡状态靠拢。

4.2.2 权责分配与利益回避机制

明确规范参与者间的权责分配,有助于厘清各方责任和义务,防止有权无责和降低无效及错误的发生。此外,自律规范公约与利益回避原则的制定绝对有其必要性。前文指出个人道德操守难以查核,为此辅以自律规范,制定高道德标准,所有参与者必须签订自我约束的公约,并阐明违者重罚的规定,以达事前警戒效果。同时,针对所有决策方案采取利益回避原则,只要接触与自身利益相关者,参与者就必须主动退出,防范不公不义的发生,树立政府的公信力。

4.2.3 信息沟通机制

政策制定过程中因为信息不对称形成逆向选择,而陷入博弈困境,甚至产生道德风险。要消弭误解并强化信任,就必须构建良好的信息沟通渠道。信息沟通机制的主要目的是在同一时间内,不隐藏且充分提供信息,为政策制定参与者传输等质等量的信息,让各方可以取得充分完整信息。机制应具备如下条件:1)营造高度信息化的使用环境,掌握宽带质量,确保网络速度;2)明确界定信息内容的公开程度,亦即清楚规范保密层级;3)提高信息透明度,以公开研讨会方式进行讨论与沟通。如此方能提高决策品质,降低实质信息不对称的发生,进而减少未来政策推行上的阻滞。

4.2.4 多层次决策管理机制

该机制采取双层委员会架构设计,委员依其专业、资历、社会声望等条件,且在利益回避原则下,以随机方式遴选委员。第一层委员会,成员较为资浅,主要负责构建决策立项、提案咨询建议以及初步审查;第二层决策联席委员会,成员资历深且社会威望高,主要负责统筹分配与协调,掌控程序流程,当专业的正当性被质疑时,从其科技专业角度提供正确见解与证据,避免决策选择的错判和时间的延宕。透过此多层次决策管理的运作,可充分反映出社会价值的偏好,促使最终决策符合社会大众的期待。

4.2.5 监督与绩效考核机制

有效的政策要搭配好的管控制度,监督和绩效考核是优良制度下不可或缺的重要机能。避免并制约权力的滥用,方能有效且合理的限制有权之人,遏阻其权力无限的扩张。政策制定的成败,通常取决于参与者道德行为是否失范。前文提到自律规范与利益回避,需要切实有效的监督问责机制。构建健全的监督机制,要点如下:1)赋予独立行使监察督考之权,避免因依附在体制内而监督失效;2)配合信息沟通机制,促使信息快速无碍的传输,发挥内外夹击、双重监督之效,进而降低失败风险;3)落实参与者财产公开透明的制度,并定期严加稽核;4)针对特定参与者,进行生活模式追踪调查,并提高查核频率。

至于绩效考核机制中评鉴规范的制定,要运用科学工具,合理的订定评核指标参数。基本上,政策制定的优劣取决于政策执行的成败。因此,要摒除政策执行过程中不客观与不合理的因素,依据政策执行主体对条文内容的反馈,设定指标参数,进行公正的系统考核,作为未来成员遴选的依凭。

从宏观角度来看,“一个国家的民主程度,最终的体现是看其政府的公共政策,即政府向社会所提供的公共产品和服务,是否均衡合理地体现了有关阶层和群体的利益”[9]15-16。换言之,政府科技政策制定的机制是针对有关阶层和群体利益,掌握其均衡性与合理性,并做出有效的决策选择。同时整合有关阶层及群体间的协调沟通及利益分配,与社会大众结合形成完整的决策体制。

在此决策体制内,各个政策主体间的活动会非常自然地将博弈行为推到各种关系纽带的节点上,从时间维度来看,无论政治生态、社会关系、群体或个人利益分配,无论各方是协调或妥协,最后都会逐渐朝“合意”方向靠拢,趋于均衡状态。由于主要政策主体间的博弈行为牵涉到社会资源分配及公共利益最大化等敏感政治问题,此时所有参与者均背负着沉重的社会责任与压力。因此,落实执行道德行为规范与贯彻决策管控制度下的机制,就相对突显其重要性。

参考文献

[1]张维迎.博弈论与信息经济学[M].上海:上海人民出版社,2005:68.

[2]陈庆云.公共政策分析[M].第2版,北京:北京大学出版社,2012:127.

[3]赵德余.公共政策:共同体、工具与过程[M].上海:上海人民出版社,2011:52.

[4]汝鹏.科技专家与科技决策[M].北京:清华大学出版社,2012:20.

[5]张曙光.制度主体行为:传统社会主义经济反思[M].北京:中国财政经济出版社,1999:13.

[6]赵德余.政策制定的逻辑:经验与解释[M].上海:上海人民出版社,2010:229.

[7]巫和懋,夏珍,等.赛局高手:全方位策略与应用[M].台北:时报文化出版社,2002:167.

[8]郑兴弟.政策规划-理论与方法[M].台北:商鼎文化出版社,2004:139.

[9]谢淑贞.赛局理论[M].台北:三民书局,1999:15-16.

CLC num be r:C 916 Docum en t code:A A rtic le ID:1003-0166(2015)02-0002-06

【中图分类号】C 916 

【文献标志码】A 

【文章编号】1003-0166(2015)02-0002-06

do i:10.3969/j.issn.1003-0166.2015.02.001 10.3969/j.issn.1003-0166.2015.02.001

Game Analysis in the Decision-making Processof Science and Technology Policy Formulation

GUANG Xiang-zhong
(ZHOU ENLAISchool of Government,NankaiUniversiyt,Tianjin 300071,China)

Abs trac t:Industrial policy is im portant in the field of pub lic policy and management while science and technology policy is the main part of industrial policy in modernized countries,and the im pact covers levels of society,peop le's livelihood,econom ic,politic,environmental ecology,even national security.The policy decision-making op tions of national level science and technology policy under a democratic political system seems to clearly be a core element for modern industrial policy making p rocess.The article introduced “Principal-agent theory”,“Adverse selection”from the econom ics of in formation,and the concep t of“Dynam ic equilibrium”in game theory.To research on the mutual influence between the main policy bodies during the science and technology policymaking p rocess base on the game perspective,through the fu ll aspect analysis on the perspective of macroscopic theory,to search out an effective decision-making op tions,and make recommendations accordingly.

Key w o rd s:science and technology policy,decision-making op tions,game theory,adverse selection,dynam ic equilibrium


免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈