首页 理论教育 数字人文系统调用API的典型案例

数字人文系统调用API的典型案例

时间:2023-11-05 理论教育 版权反馈
【摘要】:MARKUS是另外一个调用其他平台API供自己使用的典型案例。其次,我们对师范联盟数字方志集成平台使用API情况及效果进行介绍。图9-2师范联盟数字方志集成平台调用API示例MARKUS是通过CBDB、CHGIS、DDBC等不同数字人文系统提供的API来实现自动标注、提供参考资料等功能;师范联盟异构方志集成平台是通过调用CBDB、上海图书馆人名规范库实现方志责任者资料补充的目的。两者都是通过API构建数字人文基础设施的典型案例。

数字人文系统调用API的典型案例

(1)MARKUS介绍

CBDB、CHGIS、CText Project等平台都基于自己的资料库提供简单易用的API供其他平台调用。例如在CBDB官网上列出的目前正在使用CBDB API的资料库有明清妇女著作、Communication and Empire:Chinese Empires in Comparative Perspective、人名权威人物传记资料、Digging into Data:Automating Chinese Text Extraction等。MARKUS(中文译名:码库思)是另外一个调用其他平台API供自己使用的典型案例。MARKUS是由荷兰莱顿大学魏希德教授主持研发的古籍半自动标记平台。其目的是向历史学者提供一种简单容易上手的标记工具,能有效地对个人收集的研究文本进行标记,让使用中文古籍作为研究材料的学者能更容易地去尝试数字人文分析工具与研究方法[17]。作为MARKUS主要开发者,何浩洋博士指出MARKUS的成功,得益于同其他资源的相互连接,包括CBDB、CHGIS、TWGIS,以及法鼓山的DDBC,等等。一方面,MARKUS使用其他数字人文平台的开放资料作为内建词库,自动标记使用者上传文本中的人名(CBDB搜集的中国历代人物姓名、别名、官名、年号)、地名(CHGIS搜集的中国历代历史地名);另一方面,当使用者不清楚标记文字所代表的含义,MARKUS会通过调用参考资料的API链接到对应网络上的参考资料查询关于这段标记文字的解释,并显示在系统右侧的辅助区域,供使用者阅读参考。不同类型的标签预设查询的网络参考资源是不同的,人物标记会预设参考CBDB的人物生平资讯,地名标记则预设参考CHGIS的历史地理资讯,对于所有种类的标记,MARKUS都会到汉典(ZDict)与维基百科(Wikipedia)查询相关资料,使用者只需点击选择右侧辅助区域的不同页,便能切换显示不同网络资源的查询结果。

(2)师范联盟异构方志集成平台介绍

在此,我们首先对师范联盟数字方志集成平台使用API的需求进行说明。

地方志多以官修为主,由地方官员主持修纂[18]。据史料记载,早在夏禹时期,地方志就已引起官府的注意。随着社会生产力的发展和人类社会的不断进步,经济繁荣,文化昌盛,地方志的重要作用越来越受到社会的重视。在统治阶级的提倡下,地方志与官府的关系由资学发展到资治,地方志也由私修发展到官修,完成了由自发到自觉的过渡。到隋唐时期,官修地方志的制度开始确立。到了南宋,官修制度进一步完善。至此,我国初步确立了由官方设立修志机构,指派官员或聘用有学识的人员负责编纂。[19]古代方志的编纂人员多是官员或有名望的人。师范联盟数字方志集成平台[20]能够显示出关于方志的基本信息,但是用户无法了解编纂者的基本信息(生平、职官、其他作品等信息),而这些信息对于用户了解当时方志编纂的情况是必要的。在充分调研了多个人名规范库后,师范联盟数字方志集成平台调用了CBDB和上海图书馆人名规范库的API,使用师范联盟方志平台的用户同时可以看到编纂者的生平信息,这是对其知识的一种有益的丰富和扩展。

其次,我们对师范联盟数字方志集成平台使用API情况及效果进行介绍。(www.xing528.com)

师范联盟数字方志集成平台通过调用上海图书馆及CBDB的API来增补方志责任者的基本情况,其中上海图书馆主要提供关于责任者其他作品情况,CBDB主要提供责任者生平、社会网络关系等情况。调用API以责任者名字作为输入参数,并规定输出格式为html,即网页形式显示,如图9-2所示为具体示例。在关联责任者时会出现CBDB、上海图书馆都没有、都有或者只有一方有资料等多种情况。如果方志责任者在CBDB或上海图书馆人名规范库里有资料的话,则在网页上附上“CBDB”“上图”字样的链接,点击则可以跳入对应的页面。如图9-2所示,“(成化)湖州府志二十四卷(存十八卷)”中的责任者劳钺只在CBDB里有资料,责任者徐守刚在两者内都没有,其他责任者则在两者中都有。以责任者张渊为例,点开链接,分别得到其在两个平台里面的情况。其中,CBDB中收录有13个重复的名字,在上海图书馆人名规范库中则有1个。因为历史上同名的情况出现较多,因此会出现关联出错或关联到多条人物记录的情况,用户需要根据作品、生平等情况自行甄别。

通过调用CBDB、上海图书馆人名规范库的API,使得数字方志集成平台建造者能够在不花费太多人力物力的情况下完善平台信息,同时,平台使用者也可以方便地查阅方志责任者的生平、社会关系等,是对其知识的一种扩充。

图9-2 师范联盟数字方志集成平台调用API示例

MARKUS是通过CBDB、CHGIS、DDBC等不同数字人文系统提供的API来实现自动标注、提供参考资料等功能;师范联盟异构方志集成平台是通过调用CBDB、上海图书馆人名规范库实现方志责任者资料补充的目的。两者都是通过API构建数字人文基础设施的典型案例。从MARKUS及师范联盟异构方志集成平台的成功之处中可以得出以下经验:(1)在建立数字人文系统及进行有关数字人文研究时,应该充分关注其他平台提供的API,进而利用网络上权威的、有用的资料库,包括人、时、地、职官等基本资料库,也包括如佛学、古籍等专业资料库;(2)在建立自己的资料库后,应考虑其价值,尽可能地提供API接口以供其他平台调用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈