首页 理论教育 图情大数据:谷歌全球事件、语言和语气数据库

图情大数据:谷歌全球事件、语言和语气数据库

时间:2023-08-08 理论教育 版权反馈
【摘要】:全球事件、语言和语气数据库是由Google开发者Kalev Leetaru创建的全球最大、最全面、最清晰的关于人类社会的开放数据库。GDELT每隔15分钟就会更新一次全球事件数据,这些事件从1979年开始直到现在,事件库已有数亿条事件记录。6个月后,8月21—24日,当地发生暴力骚乱,叛军以重型武装侵袭的黎波里,卡扎菲政府瓦解。GDELT还提供了分析服务,将需要的查询条件输入到页面,选择需要的服务,即可在10分钟内收到数据,利用这些数据即可对其进行分析。

图情大数据:谷歌全球事件、语言和语气数据库

全球事件、语言和语气数据库(global database of events,language,and tone,GDELT)是由Google开发者Kalev Leetaru创建的全球最大、最全面、最清晰的关于人类社会的开放数据库。GDELT每时每刻监控着每个国家的几乎每个角落的100多种语言的新闻媒体,涉及印刷、广播和网页等形式,能够识别人员、位置、组织、数量、主题、数据源、情绪、报价、图片和每秒都在推动全球的社会事件,为全球提供了一个自由开放的计算平台。GDELT每隔15分钟就会更新一次全球事件数据,这些事件从1979年开始直到现在,事件库已有数亿条事件记录。GDELT第一项服务就是免费的数据下载。同时,GDELT还在Google的BigQuery上提供了数据API,可以使用Google的分析工具进行分析。GDELT的数据除了事件数据外,还提供了全球知识图(global knowledge graph,GKG)的数据。

在2013年美国国际开发总署(USAID)和人权联合会举办的模型挑战赛上,利用GDELT数据作为最后一轮技术暴行预防挑战,这个挑战要求挑战者创建一个算法模型来预测何时何地将会发生大规模暴行。数百名挑战者提交了618个算法。来自北京的数据科学家李小石开发的模型最终夺得了联合国防范暴行高科技竞赛的最高奖金。该模型是在有限或者没有历史大规模暴乱数据的情况下,每个区域只考虑23个地缘、社会政治和历史冲突因素,在区域内暴行预测特别成功。这个模型可以预测到在一个从未发生过暴乱的地区将要发生的严重暴乱,其最大作用不在于节省一个专家去预测在那些动荡地区将要发生的暴乱,而在于预测那些容易被人忽视的事件。这个算法通常的预测正确率要高于另一个常用的dummy预测模型62%,而对于那些在过去半年内没有暴乱的地区,这个模型的预测准确率却高于112%。例如,2010年,利比亚首都的黎波里周边发生暴力骚乱,在此以前,当地一直都很平静,调用GDELT数据运算,竟然准确计算黎波里在2010年3月开始变得动荡不安,并且随着时间推展,当地每月都录得5%爆发动乱的机会率。6个月后,8月21—24日,当地发生暴力骚乱,叛军以重型武装侵袭的黎波里,卡扎菲政府瓦解。(www.xing528.com)

GDELT还提供了分析服务,将需要的查询条件输入到页面,选择需要的服务,即可在10分钟内收到数据,利用这些数据即可对其进行分析。主要的分析形式有:事件浏览器、事件网络、事件时间线、事件热力图、GKG网络、GKG时间线、GKG热力图、GKG浏览等。GDELT还提供了四种解决方案,分别为态势感知、影响着网络、风险评估与全球趋势、政策反响和人权与危机处理等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈