首页 理论教育 高校图书馆元数据整合:现状及实践

高校图书馆元数据整合:现状及实践

时间:2023-11-05 理论教育 版权反馈
【摘要】:有些机构会自建元数据标准以达到更好地组织和揭示数字资源。不同标准的元数据成为资源整合首先要解决的问题。这些项目都是在元数据整合基础上提供服务,他们为解决元数据的异构问题开发了各自的方法。为将不同来源的异构元数据整合入自己的元数据仓储,一般可以先开发新的元数据方案,将采集来的异构元数据映射到新的元数据上,并开发工具实现对元数据的预处理以实现规范性、一致性,使得项目可持续发展。

高校图书馆元数据整合:现状及实践

元数据通常被称为有关数据或信息的数据,是描述、解释、定位或以其他方式使得检索、使用或管理信息资源更容易的结构化信息。在漫长的图书馆编目发展史中,由于资源本身特点或者为揭示同种资源的不同作用,形成了许多不同的元数据标准。元数据标准可以分为数据结构标准(Dublin Core、VRA Core、MODS、CDWA、EAD等)、数据内容标准(RDA、AACR2、CAPDCMBP、CCO、DACS等)、数据值标准(LCSH、AAT、TGN、W3CDTF、DDC等)、数据交换标准(MARC、XML、RDF\XML、JSON等)、数据呈现标准(CSSand/or XSLT for display、ISBD punctuation、OPAC display settings)[12]。不同发现平台会采用不同的元数据采集方法,并应用不同的元数据标准。有些机构会自建元数据标准以达到更好地组织和揭示数字资源。不同标准的元数据成为资源整合首先要解决的问题。目前在整合元数据的基础上提供服务的项目中有很多影响力较大的项目,例如欧洲数字图书馆Europeana、美国HathiTrust数字图书馆等项目。这些项目都是在元数据整合基础上提供服务,他们为解决元数据的异构问题开发了各自的方法。Europeana整合了欧洲3500多所档案馆、图书馆、博物馆的资源,提供多达51971705条图书、音视频、美术作品、手工艺品的数据供用户检索[13]。在元数据整合的过程中,Europeana专门设计了“Europeana Data Model(EDM)”数据模型来兼容博物馆、档案馆、图书馆的元数据标准,将不同标准的元数据映射到EDM模型上,从而解决资源整合中数据结构不统一的问题[14]。在数据处理的过程中,Europeana实施“收割整合后的元数据”的资源采集方式,即在Europeana和数字资源提供者之间增加了一个内容聚合器工具,实现对各数字资源元数据的规范与整合,这样可以对数字资源的规范性、有效性和一致性进行有效控制[15]。例如,Europeana专门开发了CARARE系统,用于处理具有考古价值的历史遗迹建筑艺术品、手工制品等有关文化遗产的元数据的映射、丰富、更新等预处理工作。CARARE首先根据现有考古学建筑学的元数据标准,如LIDO、CIDOCCRM、MIDAS创建一个领域特定的元数据模式,然后将其映射到EDM上,然后再进行元数据丰富、更新等一系列处理[16];HathiTrust项目整合了120多所高校图书馆的数据,目前包括16 295 881条记录、7939735本书的标题。在书目数据整合的过程中,HathiTrust项目组要求数据提供方的元数据越完整越好,必须遵循MARC21著录规范、utf8编码等标准,并专门开发了Zephir[17],在书目元数据被HathiTrust采纳前必须先经过Zephir的处理。Zephir包含一系列功能,包括对书目记录的采集、更新及一般的管理,并且元数据在经过Zephir处理时会有一个关于元数据处理情况的报告,报告内容包含多少条记录已经处理,多少条记录处理错误等总体情况,同时将错误记录打印出来。经过Zephir处理的书目元数据,可以直接被HathiTrust使用。为将不同来源的异构元数据整合入自己的元数据仓储,一般可以先开发新的元数据方案,将采集来的异构元数据映射到新的元数据上,并开发工具实现对元数据的预处理以实现规范性、一致性,使得项目可持续发展。(www.xing528.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈