首页 理论教育 高校图书馆创新实践:美国数字公共图书馆DPLA整合分析

高校图书馆创新实践:美国数字公共图书馆DPLA整合分析

时间:2023-11-05 理论教育 版权反馈
【摘要】:DPLA项目于2010年年底开始讨论、规划,2013年开放运行,它是把档案馆、图书馆、博物馆和文化遗产机构、私人收藏机构等分散的资源进行统一集合,最大限度地开放可共享的文化遗产。DPLA为了更加迅速、更大范围地收集数据开发了一款新的开源OAI收割器Spark OAIHarvester。DPLA收割后的元数据,经过MAP映射并以关联开放数据加以强化、呈现和共享。MAP基于Europeana数据模型EDM,并结合DPLA集成美国文化遗产机构元数据的经验与特定需求。

高校图书馆创新实践:美国数字公共图书馆DPLA整合分析

DPLA是通过多种方法将异构资源整合,在此基础上提供开放服务,为数字人文提供支持的典型案例。DPLA项目于2010年年底开始讨论、规划,2013年开放运行,它是把档案馆、图书馆博物馆和文化遗产机构、私人收藏机构等分散的资源进行统一集合,最大限度地开放可共享的文化遗产。DPLA整合的过程是首先从它的内容和服务中心收割数据,然后对其数据进行丰富,经MAP(Metadata Application Profile)映射存储,最后通过API发布数据。

(1)DPLA主要通过OAI,以及内容中心或服务中心提供的API收割来自两个中心的元数据[19]。OAI协议被应用于DSpace、WorldCat、NASA、LibGuides、Omeka等一系列组织的分享、收集数据过程中。DPLA为了更加迅速、更大范围地收集数据开发了一款新的开源OAI收割器Spark OAIHarvester。Spark是分布式处理引擎,可实现并行处理大量数据,使得数据处理的速度更快。Spark的另一优点是它支持结构化的数据处理,它提供诸如SQL查询、机器学习算法、图形计算等一系列内建库,使得收割来的数据更容易检查、分析和操作。在Spark OAIHarvester的帮助下,DPLA收割数据、处理数据更加方便、简单。

(2)DPLA收割后的元数据,经过MAP映射并以关联开放数据加以强化、呈现和共享。MAP基于Europeana数据模型EDM,并结合DPLA集成美国文化遗产机构元数据的经验与特定需求。EDM主要使用来自其他命名空间的属性,加上少数独特的本地开发属性,为集成来自欧盟不同机构的多样化数字对象的元数据而开发,是一种开放的、跨领域、基于语义网框架的数据模型[20]。MAP起草于2012年,于2013年年初发布为最初的版本v3.0,2014年7月略作更新为v3.1,2015年3月发布v4.0,2017年12月发布最新版v5。MAP(v5)[21]根据实施过程中的需求及意见在原来的版本上修改而成,其具体情况如图7-2所示:MAP(v5)有9个核心类,其中使用了来自 edm的 Place、TimeSpan、Agent、WebResource,来自 skos的 Concept,来自 dcmitype的 Colllection和ore的Aggregation。对象间的属性关系也是采用dc、dcterms和edm定义的层级关系。通过MAP映射的DPLA数据在Web上开放、共享,成为具有相互联系且可参引的数据,可与其他平台数据直接联系,形成一个开放的、可无限延伸与扩展的资源整合体系。

(3)DPLA提供统一检索界面,并提供API接口调用其函数,目前API使用的数据未更新到最新版,仍采用v3.1[22]。其最基本的API调用格式为“https://api.dp.la/v2/items?q=weasels&api_key=”。 其中,“https://api.dp.la/v2”是基本格式,“items”指的是请求的“资源类型”,除“items单条记录”外还有“collections集合”,“?q”后面跟的是具体参数,“&api_key”后面跟的是从DPLA取得的32位字符串形式的key。其返回的格式为“JSON-LD”格式,如下所示:(www.xing528.com)

图7-2 DPLA概览

来源:https://drive.google.com/open?id=1fJEWhnYy5Ch7_ef_-V48-FAViA72OieG。

DPLA通过API与其他系统整合,程序开发者可通过API访问DPLA元数据,DPLA原来的官网上有专门的“Apps”网页,上面列举了34款通过DPLA提供的API接口开发的应用。DPLA整合的方法值得借鉴,其通过OAI收割数据,并复用EDM、SKO等成熟词表,发布关联数据与其他资源整合。DPLA拥有大量的、经过加工处理的、较为完整规范的元数据信息,是重要的数据基础设施,可用于文本分析和挖掘,当前许多优秀的数字人文研究案例已开始受益于这些基础设施[23]。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈