首页 理论教育 基于网格应用的数字图书馆

基于网格应用的数字图书馆

时间:2023-02-18 理论教育 版权反馈
【摘要】:在这一点上,网格架构的环境与数字图书馆的信息环境要求是完全一致的。从解决问题的方案本质来看,资源的规范组织、语义互联和智能聚合是网格和数字图书馆共同的目标。

基于网格应用的数字图书馆

2.6.2 基于网格应用的数字图书馆

1.信息网格与数字图书馆的共性

在网格技术的发展中,由欧洲网格项目提出的计算(数据)网格、信息网格和知识网格框架得到广泛认同。该框架是一种从下至上的三层结构,上层需要使用下层提供的功能。最下层的计算和数据网格主要解决数据访问的问题。在此层次中,人们用网格技术将世界上不同地域、不同接口的各种设备、资源连接起来,形成一种方便访问的途径。信息网格建立在数据网格层次之上,该层次将异构的信息访问变成同构的信息访问。异构信息访问指的是,虽然在下层已经建立了随处可用的数据访问通路,但是这些数据并不能很好地为人们所使用。由于各自来源不同,它们具有全然异构的数据格式而无法直接使用。比如互联网网页、关系数据库表以及其他信息载体,它们往往是用各自不同的格式去表示本质上相同或相近的信息。要解决此类问题,就需要建立针对信息内容的统一表示、转换机制以及同构访问。在这一点上,网格架构环境与数字图书馆的信息环境要求是完全一致的。同时,基于开放网格服务体系结构第三阶段的网格技术也能够对建立这一信息环境提供支持。

信息网格主要完成广泛异构信息的统一表示、结构化、信息转换,基于信息理解的智能化检索,以及针对特定用户需求的信息服务等三大方面[61]。数字图书馆则需要分布式的广域网环境,希望能够通过分布式资源的集成和整合,为用户提供一站式的服务。因此数字图书馆可以通过信息网格基础设施的资源管理和调度方案实现这一点。从解决问题的方案本质来看,资源的规范组织、语义互联和智能聚合是网格和数字图书馆共同的目标。资源的规范组织提出资源空间模型和资源的规范化组织和管理的理论、方法、技术和工具,使各种无序资源(硬件资源、信息、知识和服务等)得到规范组织,使用户能够有效、正确地操作各种资源,以提高资源的使用效率。语义互联则通过多层语义互联和单一语义映像,使分布在全球的各种网络资源在语义层上互连,消除资源孤岛,可以通过类型化的语义链来使资源的语义能被机器所理解;智能聚合则解决如何使资源能够互相理解,根据用户的需求有效、动态、智能地查找和聚合各种资源,这可以通过网格统一调度平台来实现。因此,网格技术,尤其是信息网格和Web服务资源框架WSRF为数字图书馆的互操作提供了借鉴:利用信息网格的资源共享和协同工作机制以及WSRF框架服务管理的灵活性,可以将数字图书馆作为动态的虚拟组织,将其资源以服务的形式发布,通过网格平台对服务进行管理,考虑不同用户的信息需求,利用平台对服务进行自动调度,从而实现用户“一站式”的检索以及数字图书馆的互操作。

2.国内外数字图书馆信息网格项目

如何将网格技术应用于数字图书馆,目前并没有一个统一的模型可以参考,国内外很多机构和院校进行了这方面的探讨[62]

目前国外比较有名的数字图书馆信息网格项目主要有以下几个:

(1)DILIGENT(http://www.diligentproject.org/)

DILIGENT是欧盟于2004年启动的虚拟数字图书馆原型项目,试图通过结合网格技术与数字图书馆技术,使来自动态虚拟组织的成员能够创建个人虚拟数字图书馆,共享计算资源、存储资源、多媒体资源、多类型内容资源以及多类型应用资源。启动DILIGENT原型是欧洲数字图书馆建设逐步向虚拟数字图书馆迈进的重要举措。目前DILIGENT项目基本完成,形成基于服务的应用框架gCube。该框架体系中使用了网格中间件gLite。DILIGENT的结构体系由3层结构组成:收集层、数字图书馆层、应用细节层。其中包含一系列提供交互的应用服务:典型的数字图书馆功能服务,如查询、文档类型、结果可视化等;获取第三方提供的应用与服务;处理共享的上下文和应用资源;支持临时性数字图书馆服务的创建和操作。这些服务可以充分利用EGEE网格的高效计算和存储能力。

(2)GRACE(http://www.grace-ist.org/)(www.xing528.com)

GRACE项目建立在欧洲DataGrid网格技术(LCG middleware)的基础之上,GRACE项目注重本体与语义互用在网格结构中的应用。它由5层结构组成:数据层、采集层、网格服务层、GRACE特性层、Web应用层。在GRACE特性层,能够系统地采集文档的相关信息;使用自然语言处理技术,对文档在知识域中重新索引并分类;使用本体查询内容来源,并按照内容关联对其按关键词进行索引;允许GRACE为某一个特定的需求,仅仅抽取内容外延的某一个部分;本体被更进一步用于查询、索引、浏览和表达检索结果。Grace已经完成了原型系统的建设,原型系统中使用了INFN Grid的中间件产品以及监控工具GridICE。

(3)GridIR(http://www.gir-wg.org/index.html)

GridlR项目建立在网格结构基础上,致力于研究制定网格环境下分布式信息检索的标准。GridlR由4部分组成:元数据服务、收集管理服务、索引和检索服务、查询处理服务。由于网格结构的分布式特性,GridlR项目主要研究这4个模块之间的通信交互模型。GridlR结构体系使用标准、简单的格式实现文档和查询的交换。它尽可能地利用已经规范化的信息查询标准,如Z39.50 RPN询问、属性集合等,并利用现有的技术将这些标准(如Z39.50)向WebService平台转移。该项目中有很多子项目,但还没有形成最终统一的标准,这些子项目中有一部分也提供开发工具,如Etymon、amberfish、Isearch等。

(4)Digital Library Grid(http://128.82.7.230/grid/index_ new.html)

该项目由弗吉尼亚大学数字图书馆项目组负责,主要目的是建立一种统一的基础服务,能够为所有的数字图书馆提供统一的接口,引入OAI框架解决现有的数字图书馆使用异构技术的问题。例如,使用OAI框架解决分布式文档的发现和使用问题,使用类似联合搜索引擎(ARC)的模型解决提供基于信息收集的附加服务。在该项目网站中,提出了5种元数据收集模型,模型中使用了一些现有的发布工具Kepler、Dspace等。

(5)Freelib(http://p2pdl.cs.odu.edu/)

该项目同样由弗吉尼亚大学数字图书馆项目组负责,但它是一种基于P2P网络的新型数字图书馆试验系统。它以现有OAI、P2P以及社会性网络的研究成果为基础,将数字资源的发布、搜索、管理和维护分散到基于P2P的数字图书馆网络中去,既降低数字图书馆的整体管理和维护成本,又能够保持对多样的数字社区动态演变的支持。

我国对数字图书馆信息网格的研究相对较少,很多工作刚刚起步。CALIS管理中心正在研究如何运用网格技术来构建下一代的“中国高等教育数字图书馆”,具体研究内容包括:针对数字图书馆的数据资源、信息资源等,利用网格技术将这些资源有效地聚合起来,实现资源的广泛共享,提供高性能的信息服务平台(例如,网上培训网格、数字图书馆网格接口规范与集成模式、电子全文共享网格、多媒体课件共享网格、分布式检索网格、海量资源的存储网格等),协同工作平台(例如,合作研究网格、科研服务网格等);清华同方股份公司的CNKI网格资源共享平台;织女星网格数字图书馆通用平台的研究等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈