首页 理论教育 政治宣言公众编码改进方案介绍

政治宣言公众编码改进方案介绍

时间:2023-07-21 理论教育 版权反馈
【摘要】:图5.5贝努瓦等人的编码方案。为了评估上述公众编码的质量,贝努瓦和同事还让大约10名专家,即政治科学领域的教授和研究生,用类似的步骤对相同的宣言进行了编码。图5.6在对英国政党发表的18则宣言进行编码时,公众编码评估结果与专家编码评估结果吻合度非常高。在此基础上,贝努瓦和同事利用他们的公众编码方法,开展了宣言项目专家无法完成的研究。为了研究移民政策,他们对英国2010年大选期间8个政党所发表的宣言进行了编码。

政治宣言公众编码改进方案介绍

通常由专家进行的政治宣言编码也可以通过人本计算来完成,后者还能实现更大的再现性和灵活性。

与星系动物园发起人相似,社会研究人员在许多情况下也想对图像或文本进行编码、分类或标注。其中一个例子就是对政治宣言进行编码。在竞选期间,政党会发表表明其政策立场和指导思想的宣言。例如,以下就是一则英国工党在2010年的宣言:

在我们的公共服务体系中工作的数百万名工作人员,他们践行着英国最崇高的价值观——为让人们能够充分利用他们的生命而贡献自己的力量并保护他们免受那些不应独自承受的风险的伤害。正如我们需要让政府在使市场公平运作方面扮演更加果敢的角色,我们也需要果敢地对政府进行改革。

对于政治科学家,尤其是那些研究竞选和政策辩论动态的政治科学家来说,这些宣言包含了非常有价值的数据。为了系统地从这些宣言中提取信息,研究人员创建了一个宣言项目,共搜集了50个国家的近1000个政党所发表的4000则宣言,然后组织政治科学家采用56类方案对每则宣言的每句话进行了系统的编码,最终建立了一个庞大的数据集,整合了这些宣言中所包含的信息。目前已有200多篇科学论文使用了该数据集。

肯尼思·贝努瓦(Kenneth Benoit)和同事决定把以前由专家进行的宣言编码转化成一个人本计算项目。于是,他们创建了一个更具再现性和灵活性的编码过程,其低成本和快速就更不在话下。

贝努瓦和同事采用分解-运用-整合这一策略,让来自微任务劳动力市场(机器人MTurk和众包公司CrowdFlower都是微任务劳动力市场的例子,更多有关该类市场的内容可参见第4章)的工人对英国从1987年到2010年间的6次大选所发表的18则宣言进行了编码。首先,研究人员将每则宣言分解为一个个句子。然后,工人运用编码方案对每句话进行编码。具体来说,他们被要求将每句话归类为经济政策(偏左或偏右)、社会政策(自由主义保守主义)或两者都不是(图5.5)。每句话都大约有5个不同的人对其进行分类。最后,在考虑个人因素影响和句子难度影响的前提下,研究人员利用一个统计模型对所有分类数据进行整合。最终贝努瓦和同事从大约1500名工人那里搜集了20万条分类数据。(www.xing528.com)

图5.5 贝努瓦等人的编码方案。工人被要求将每句话归类为经济政策(偏左或偏右)、社会政策(自由主义或保守主义)或两者都不是。改编自Benoit et al.(2016),图1。

为了评估上述公众编码的质量,贝努瓦和同事还让大约10名专家,即政治科学领域的教授和研究生,用类似的步骤对相同的宣言进行了编码。尽管公众分类的个体一致性低于专家,但经过整合所得出的公众一致分类数据与专家一致分类数据吻合度非常高(图5.6)。与星系动物园一样,上述比较表明人本计算项目也能产生高质量的结果。

图5.6 在对英国政党发表的18则宣言进行编码时,公众编码评估结果与专家编码评估结果吻合度非常高。上述宣言是6次大选(1987年、1992年、1997年、2001年、2005年和2010年)期间三个政党(保守党、工党和自由民主党)所发表的。改编自Benoit et al.(2016),图3。

在此基础上,贝努瓦和同事利用他们的公众编码方法,开展了宣言项目专家无法完成的研究。例如,宣言项目的编码方案并没有涉及移民这一话题,因为在制订编码方案的20世纪80年代中期,移民并不是一个很突出的话题。但让宣言项目团队返回去重新编码他们的宣言以获取这一信息在组织实施上是不可行的。因此,有兴趣研究移民政治的研究人员似乎不太走运。但贝努瓦和同事利用他们的人本计算方法可以轻松且快速地进行这一编码。

为了研究移民政策,他们对英国2010年大选期间8个政党所发表的宣言进行了编码。每则宣言中的每个句子都需按照其是否与移民有关来编码,如果有关,还要判断是支持移民、中立,还是反对移民。项目启动后5个小时内,他们就搜集到了22000多条回复,总成本是360美元。而且,公众的评估结果与之前专家的评估结果吻合度非常高。两个月之后,他们又让公众对相同的宣言进行了一次编码,作为最后的检测。然后,他们在几小时内便创建了一个新的与最初的公众编码数据集高度匹配的公众编码数据集。换句话说,人本计算使研究人员能够生成与专家评估一致的政治文本编码数据,而且该数据还具有再现性。此外,因为人本计算快速且便宜,所以他们可以很容易地根据移民政策这一特定的研究问题来调整他们的数据采集。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈