首页 理论教育 数字信息资源配置:Web信息资源的语义需求

数字信息资源配置:Web信息资源的语义需求

时间:2023-11-06 理论教育 版权反馈
【摘要】:语义Web为信息资源配置和开发利用提供了良好的基础平台。对数据集成需求的增加在Web信息资源开发利用中,对共享语义及从中导出的数据和信息集成的需求增加了。[72]语义Web是一个可控信息的Web,通过解释符号的语义理论从数据中抽取信息。语义Web服务的目标是促进语义表示技术

数字信息资源配置:Web信息资源的语义需求

HTML(Hypertext Markup Language,超文本标记语言)是为了满足早期的“适用性”和“简易性”要求而推出的标记语言,其内容用来供人阅读和理解。HTML存在一些致命的弱点,主要表现在以下三个方面:显示方式内嵌于数据之中;在数据中寻找信息和知识非常困难;数据自身的逻辑不得不屈服于HTML语言规范的逻辑。如果用软件处理数据,不得不遍历整个HTML文件,把所有的HTML标记剔除掉,再把剥离出来的有用的数据重新组织。因此,任何一个不是单纯为了显示HTML文件的应用程序,在处理一个HTML文件中的数据时,都不得不做大量额外的工作,这必然导致Web信息资源开发利用的效率不高。

在Web上同时具有文档和数据的语义Web观点在Web产生的开始便存在了。语义Web能够提供一个公共架构,以允许数据在应用、企业和领域间得到共享和重用。语义Web为信息资源配置和开发利用提供了良好的基础平台。

目前,在Web应用之间传递内容仍然很困难。如果机器明白内容,则存在多种机器使用Web内容的方法。所选信息间相互关系的发现能够将分隔而孤立的信息变成有意义的上下文,所揭示出的隐含结构将帮助用户更有效地利用和管理信息。这种从语义上链接不同数据源(文本、图像、人、概念等)的思想非常重要。这样,人们能够从当前具有简单链接的Web转向更具语义表示的丰富的Web,在这个Web中,人们能够逐渐增加含义,并在资源间表达一个全新的关系集,使得当前Web中隐含的特殊上下文关系变得更加清晰。这将为有效的信息集成、管理和自动服务打开全新的渠道。

(1)对数据集成需求的增加

在Web信息资源开发利用中,对共享语义及从中导出的数据和信息集成的需求增加了。例如,生命科学研究需要来自于不同领域的多种异构数据集的集成。基因、细胞、临床医药实验、流行病学领域的科学家、研究者和调整机构都需要一种集成这些构件的方法。它采取基于本体的公共概念来得到实现。[70]

许多其他学科正在采取生命科学所采用的方法。例如,环境科学正在尝试集成来自水文、气候、生态学、海洋学的数据。[71]在科学研究的每个领域,都需要把握不同系统的需求,并呈现出对数据和信息集成的迫切需求。

(2)从文档Web到数据Web

人们每天使用着很多数据,但这些数据不属于Web的一部分,因为这些数据由应用控制,而每个应用都保留着自己的数据。

语义Web不是一个独立的Web,而是当前Web的扩展。在当前Web基础上增加一个语义层(数据Web),便形成语义Web。语义Web同时包含文档和数据,其中的文档将由人来处理,数据主要由机器来处理。《科学美国人》上的那篇有关语义Web的文章发表于2001年,它描述了Web从包含大量的供人阅读的文档到包含供计算机操纵的数据的进展。[72]语义Web是一个可控信息的Web,通过解释符号的语义理论从数据中抽取信息。语义理论提供了一些通过逻辑关联词构建系统间交互的含义。[73](www.xing528.com)

数据Web与现在体验到的Web看起来非常不同,它使得人们能够将正确的数据利用到某个特定的使用环境。例如,打开日历观察商务会议、旅行安排、在时间上适当安排的金融交易。

数据Web主要由RDF(Resource Description Framework,资源描述框架)文档构成。RDF是语义Web的一个基本构件。当来自两个RDF数据源的信息需要合并时,可以将文件连接成一个大的文件——将被定义成对应相同的URIs(Universal Resource Identifiers,统一资源标识符)的词汇进行合并。如果扩展对RDF文件的检索以便包括其他限制时,则可以仅仅增加限制作为合并的一部分。因而,XML(Extensible Markup Language,可扩展标记语言)由元素和属性构成;RDF数据由陈述构成,每个陈述表达某个事物属性的值——与数据库中表的一个单元格恰好同等。所有关系数据库的工作如联接(joins)和视图(views),在RDF中利用公共工具都很容易得到表示。[74]

企业应用集成的问题在于:来自每个应用的信息以RDF输出,或转变成RDF。对这个数据的选择可以运行任意的检索,筛选器(filters)能够被简单地书写,转换器(converters)可用于抽取和计算所需要的数据,数据可容易地再输入到其他需要它的应用中。基本上,应用集成问题与系统的大小呈线性关系。正如一个新的Web服务器能够在不影响其他服务器的情况下适合于Web,新的RDF应用可以在不影响系统其他部分的情况下提供和使用信息;正如当前Web上的文档可以链接成Web一样,数据也能够链接成Web了。[75]

(3)Web服务资源开发利用的语义需求

WSDL(Web Services Description Language,Web服务描述语言)形成了Web服务技术的基础构件,允许对一个基本服务的输入输出消息以及Web服务调用所需求的其他细节在语法上进行描述。然而,WSDL不支持对构成基本服务的工作流的描述。

同时,人们也逐渐意识到对Web服务丰富语义描述的需求,以便促使服务准备和使用上更完整和更灵活的自动化处理,支持更有力的工具和方法构建,并促进语义上构建良好的有关服务推理的使用。因为一个丰富的表示语言允许对服务的不同方面进行更全面的描述,因而能够在Web服务生命周期中提供更广范围活动的更好基础。例如,丰富的语义能够支持服务选择和调用的更多自动化处理,异构交互服务间消息内容的自动化转换,服务构成的自动化或半自动化方法,以及服务控制和失败恢复的更广泛的方法。此外,丰富的语义还能帮助提供以下活动的更多的自动化,如服务的验证、模拟、配置和流通。[76]

为了满足这个需求,研究者开发了相关的语言、架构和方法,特别是OWL-S(Ontology Web Language for Services,Web服务的本体语言)的开发,它构建在OWL之上,寻求为丰富的语义服务描述编码提供构建模块。OWL-S和其他相关工作为Web服务能力扩展打下了基础。语义Web服务的目标是促进语义表示技术的快速采纳,因此,研究者在开发OWL-S时,努力构建一种机制,以便OWL-S能够与流行的Web服务标准如WSDL一起使用。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈