首页 理论教育 元数据管理,元数据提供、注册及分布式管理

元数据管理,元数据提供、注册及分布式管理

时间:2023-02-18 理论教育 版权反馈
【摘要】:因此,迫切需要建立一种元数据的注册制度,各种元数据标准的生成、修改都需通过注册。EDR的管理人员将下载和考察该数据草案。

元数据管理,元数据提供、注册及分布式管理

2.3.2 元数据管理[50]

元数据应用有利于Web资源朝着有组织、可发现的方向发展,但要实现这一目标,元数据自身的管理同样至关重要,目前的研究主要包括元数据提供、注册和分布式管理三方面。

1.元数据提供

虽然取得了某些共识,元数据的提供主要由网络资源内容的作者在制作的同时提供,但这种机制显得有些脆弱,因为互联网是一个无领导实体的松散世界,推崇自由发展,使由资源作者提供元数据缺乏保障,况且虽然资源作者提供元数据的初衷是促使资源的发现,不过更大的动力却是使它们的网页能在搜索引擎的检索结果相关性排序中被排在前面,这一现实使人们对他们所提供的Metadats的公正性、客观性产生猜测,而且这种元数据的欺骗性也是客观存在的。因此,有专家呼吁由第三者(机构)更客观、公正地对Web资源进行编目。

但是,首当其冲的问题是难以应付Web上巨大的呈指数级增长的资源,目前权宜之计是提倡网页制作者提供元数据,而以图书馆为代表的专业信息团体针对质量高、价值大、寿命长的那一部分资源进行编目,制作元数据,OCLC的InterCat就是一个进行中的成功实践。同时,研制自动制作网站、网页的元数据软件,提供针对具体网页生成元数据的技术环境,这样就可以对不带元数据的网页、网站利用计算机软件自动生成元数据,同时为网页制作者编写元数据创造条件。英国的基于主题服务的网络资源组织与发现计划(Resource Organization and Discovery in Subject based Services Project,ROADS)已经利用计算机网络技术,研制出提供针对具体网页生成DC Metadeta的机制的软件,并有了一定的推广应用,但是自动生成元数据的软件研究,尚处试运行中,还未达到实际推广运用阶段。

2.元数据的注册

目前,Web上元数据的现状是各种标准太多,仍有许多团体为了某种领域资源描述的需要而不断制订新的标准,而这些组织在制订新标准时,并不知道在该领域是否已有标准存在,因此可能在同一领域存在着几种不相容的标准。造成这种局面的原因之一是没有一种大家所熟悉的渠道来了解元数据的状况。因此,迫切需要建立一种元数据的注册制度,各种元数据标准的生成、修改都需通过注册。这种注册机制应该最终通过一个国际性的权威机构(国际标准化组织(ISO)就成立了一个名为元数据工作小组的组织)协调运作,而且该机构应该承担各种元数据标准的规范化、标准化工作。网络环境下,为了促进资源发现,确保资源共享,并最大限度地开发利用网络资源,网络信息组织的规范化、标准化尤显重要。

同时,这种注册制度也提供了一种根据网络资源特点变化,而不断完善元数据标准的机制,创造了一种让最终用户直接参与元数据增添、修改的维护环境。到目前为止,这方面的探讨多于行动,但是目前已有美国环境保护局(US Environmental Protection Agency,EPA)和澳大利亚健康和福利协会(Australian Institute of Health and Welfare,AIHW)建立了它们的Metadata注册制度。(www.xing528.com)

美国环境保护局(http://www.epa.gov/edr/)为其网上环保文献的组织与检索提出了一个关于元数据管理方面的计划,旨在建立一种数据注册制度,使元数据元素更完善,更具操作性和可扩展性,从而促进元数据的使用和发展。

该注册计划,欢迎最终用户注册成为EDR的正式用户(正式用户的权限包括:向管理人员反馈EDR Metadata元素使用信息,注册追踪某个特定数据元素的发展情况,提交对个别数据元素的评论等),和EDR的管理人员一起直接参与该系统元数据的管理。作为正式用户,当你认为某个数据是你需要的,但它却没被正式注册时,你可以直接通过EDR的网址,以一定的格式联机提供该数据,作为该系统一个元数据的元素草案,这是使该数据成为一个标准元数据元素的第一步。EDR的管理人员将下载和考察该数据草案。此外,一般用户也可以通过写信和E-mail的方式,向EDR提供数据。

3.元数据的分布式管理

元数据为数字图书馆提供了很好的信息资源描述办法,MARC和DC等各种元数据标准在数字图书馆中得到了很好的应用,但是元数据标准的多样化、分布式存储也给信息资源共享带来了障碍,因此需要专门的技术来实现数字图书馆中元数据的互操作技术以及分布式管理。目前,主要是采用OAI-PMH(Open Archives Initiative Protocol for Metadata Harvesting)协议和ZING协议来解决该问题[51]

所谓OAI-PMH协议是使用TCP/IP协议作为收割者和仓储之间的传输框架。在这个互操作框架中有两种不同的角色:数据提供者和服务提供者。其中,数据提供者是元数据的发布方,一般拥有一个或多个仓储,采用OAI技术框架发布元数据,使服务提供者可以根据自己的需要对这些元数据进行收割加工,服务提供者是元数据的收割方,使用OAI协议向数据提供者发出请求,并接收返回的元数据作为构造附加服务的基础。一个服务提供者可以收割多个数据提供者的数据。

所谓ZING(Z39.50-International Next Generation)是Z39.50开发团体为使Z39.50能够适应新的网络协议和应用模式要求,而对其进行简化和创新的结果,于2002年上半年正式发布。其核心是SRW(Search/Retrieve Web Service)和SRU(Search/Retrieve URL Service),合称为SRW/U。这两者是针对Web的信息检索协议,利用Web服务架构实现Z39.50的一些基本服务,支持网络上现存的多种检索方式。其中,SRW使用HTTP与SOAP的无状态通信,采用XML作为信息传输编码,也可以单纯使用URL传递查询请求,用WSDL来定义Z39.50传输的格式信息,检索结果也以XML格式输出;SRU只能通过URL参数方式提交检索请求,不支持完整的SOAP消息包[52]

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈