首页 理论教育 本体建库方法论的分析介绍

本体建库方法论的分析介绍

时间:2023-02-18 理论教育 版权反馈
【摘要】:这都会给本体建库工作带来一定的难度。另一方面,IDEF家族中的方法都是互相补充的。IDEF5提出的本体建设方法包括以下五个步骤:组织和范围:确定本体建设项目的目标、观点和语境,并为组员分配角色。IDEF5构建本体的方法在于获取现实世界客观对象的定义,以及它们的属性和它们之间的内在联系。

本体建库方法论的分析介绍

4.1.1 本体建库方法论

纵观软件工程发展的历程,软件开发经历了一个从个人或小团队的自由开发到规范化、阶段化和高控制的发展过程。现今本体工程的开展类似于早期的软件开发工作,这是因为任何技术都有着自己的生命周期,本体技术的发展还处于初步阶段。但也表现出了一些现代软件工程的特点,这是由本体开发的工程性和与软件开发的其他相似点所决定的。本节将重点讨论由本体技术的一些特性所产生的本体开发方法学上的问题。

对本体的研究以及本体建库工作已经开展了一段时间,这一阶段产生了许多有影响力的本体项目。这些项目的研究人员根据系统开发实践提出了一些各自的本体构建原则和方法。但由于这些原则和方法都是研究人员在各自的开发经验之上提出的,并且本体构建与领域极度相关,所以各个系统开发所产生的原则和方法都不尽相同。一般认为,Gruber在1995年提出的5条规则是比较有影响的:

●明确性和客观性:本体应该用自然语言对术语给出明确客观的语义定义。

●完整性:所给出的定义是完整的,能表达特定术语的含义。

●一致性:知识推理产生的结论与术语本身的含义不会产生矛盾。

●最大单向可扩展性:向本体中添加通用或专用的术语时,通常不需要修改已有的内容。

●最少约束:对待建模对象应该尽可能少列出限定约束条件。

本体建库具有领域特性,这种领域特性不仅表现在本体库中的类和属性具有领域差异,本体建库所处理的数据源也表现在格式和内容上的差异。格式的差异体现在数据源的数据类型不一样和文本结构化程度不一致等。内容上的差异体现在信息密度不一致和有效信息的颁布不一致。这都会给本体建库工作带来一定的难度。实际的本体建库工作应该在充分借鉴具有类似领域特性或需求特性的一些本体项目的经验基础上,结合自身实际来开展。国际上比较有影响力的本体建库方法有:IDEF5法、骨架法、TOVE法、METHONTOLOGY法、KACTUS法和SENSUS法。

1.IDEF5法[1]

IDEF的概念是在20世纪70年代提出的,在结构化分析方法的基础上发展起来的。1981年美国空军公布的ICAM(Integrated Computer Aided Manufacturing)工程中首次用了名为“IDEF”的方法。IDEF是ICAM DEFinition method的缩写,到目前为止它已经发展成为一个系列。

IDEF5通过两种语言形式(即图表语言和细化说明语言)来获取某个领域的本体。这两种语言是互为补充的,IDEF5的图表语言在表达能力的某些方面是很有限的,但是这种绘图方式又使得它很直观,容易被理解;而IDEF5的细化说明语言,是一种具有很强的表达能力的文本语言,它可以把隐藏在图表语言内的深层次的信息描述清楚,从而弥补图表语言的不足。另一方面,IDEF家族中的方法都是互相补充的。例如在一个概念模型的描述中会遇到很多相继发生的事件,即一个过程。那么对这些过程的描述也需要有一个很好的支持语言,IDEF3(Process Flow and Object State Description Capture Method)正是一种为获取对过程的准确描述所用的方法。它提供过程流图和对象状态转移网图(OSTN)这两种图表来获取、管理和显示过程。IDEF5提出的本体建设方法包括以下五个步骤:

(1)组织和范围:确定本体建设项目的目标、观点和语境,并为组员分配角色。

(2)数据收集:收集本体建设需要的原始数据。

(3)数据分析:分析数据,为抽取本体做准备。

(4)初始化的本体建立:从收集的数据当中建立一个初步的本体。

(5)本体的精练与确认:完成本体建设过程。

IDEF5方法提供了一种结构化的方法,利用该方法,领域专家可以有效地开发和维护领域本体。IDEF5构建本体的方法在于获取现实世界客观对象的定义,以及它们的属性和它们之间的内在联系。

2.骨架法[2]

Mike Ushold和MichealGruninger的骨架法(Skeletal Methodology),只提供开发本体的指导方针。包括如下步骤:

(1)确定本体应用的目的和范围:根据所研究的领域或任务,建立相应的领域本体或过程本体,领域越大,所建本体越大,因此需界定研究的范围。

(2)本体分析:定义本体所有术语的意义及其之间的关系,该步骤需领域专家的参与,对该领域越了解,所建本体就越完善。

(3)本体表示:一般用语义模型表示本体。

(4)本体评价:本体的评价标准是清晰性、一致性、完善性、可扩展性。清晰性指的是本体中的术语应被无歧义地定义;一致性指的是术语之间关系逻辑上应一致;完整性指的是本体中的概念及关系应是完整的,包括该领域内所有概念,但很难达到,需要不断地完善;可扩展性指的是本体应用能够扩展,在该领域不断发展时能加入新的概念。

(5)本体的建立:对所有本体按以上标准进行检验,符合要求的以文件的形式存放,否则转(2)。

骨架法流程图见图4-1。

img29

(www.xing528.com)

图4-1 骨架法流程图

3.TOVE法[3]

Micheal Gruninger和Mark S.Fox的企业建模法(TOVE),在TOVE项目中得到了应用,TOVE是多伦多大学EIL实验室(Enterprise Integration Laboratory)研究的一个课题,它的目标是建立一套为商业和公共企业建模的集成本体,并且已经建成了相关本体。作为该项目的一部分,他们设计了一套创建和评价本体的方法“Enterprise Modelling Methodology”。该方法主要分为以下步骤:

(1)设计动机:定义直接可能的应用和所有解决方案。提供潜在的非形式化的对象和关系的语义表示。

(2)非形式化的能力问题:将系统“能够回答的”问题作为约束条件,包括系统能解决什么问题和如何解决。这里的问题用术语表示,答案用公理和形式化定义回答,由于是在本体没有形式化之前进行的,所以又称之为非形式化的系统能力问题。

(3)术语的形式化:从非形式化能力问题中提取非形式化的术语,然后用本体形式化语言进行定义。

(4)形式化的能力问题:一旦本体内的概念得到了定义,系统能力问题脱离了非形式化,演变为形式化的能力问题。

(5)将规则形式化为公理:本体中的公理指定了术语的定义以及约束。将公理用一阶谓词逻辑表示出来。

(6)调整问题的解决方案,从而使本体趋于完备。

TOVE流程图见图4-2。

img30

图4-2 TOVE流程图

4.METHONTOLOGY法[4]

METHONTOLOGY法,专用于构建化学本体(有关化学元素周期表的本体),该方法已被马德里大学理工分校人工智能图书馆采用。它的流程包括:

(1)管理阶段:这一阶段的系统规划包括任务的进展情况、需要的资源、如何保证质量等问题。

(2)开发阶段:分为规范说明、概念化、形式化、执行以及维护五个步骤。

(3)维护阶段:包括知识获取、系统集成、评价、文档说明、配置管理五个步骤。

目前,用这种方法开发的本体有:(Onto)2Agent,它是基于本体的Web代理,使用参考本体作为知识源,在一定的约束条件下进行新知识获取的工具;化学本体:基于本体的化学教育代理,允许学生在学习的基础上自测本身在该专业领域内所达到的水平; Ontogeneration:使用化学领域本体和语言本体来生成西班牙语的描述,并把这些描述作为对学生关于化学领域问题查询的答案。

5.KACTUS法[5]

KACTUS工程法是基于KACTUS项目而产生的。KACTUS是“关于多用途复杂技术系统的知识建模”工程英文的缩写,是欧洲ESPRIT框架下的研发项目之一。该项目的目的是开发出技术系统生命周期的知识重用方法学,以便在设计、诊断、操作、维护、再设计和培训时使用同一知识库。该方法主要包括:

(1)应用说明:提供应用的上下文和应用模型所需的组件。

(2)相关本体范畴初步设计:搜索已存在的本体,进行提炼、扩充。

(3)本体的构造:用最小关联原则来确保模型既相互依赖,又尽可能一致,以达到最大限度的系统同构。

6.SENSUS法[6]

SENSUS法是用于自然语言处理的SENSUS语言本体的开发方法,由美国USC/ISI研制。ISI自然语言研究小组旨在为机器翻译提供广泛的概念结构。SENSUS为机器翻译提供概念结构,用该方法开发的SENSUS本体系统用于自然语言处理程序。目前SENSUS语言本体共包括电子科学领域的7万个概念。为了能在SENSUS基础上构造特定领域的本体,必须把不相关的术语从中剪除。

国内也有本体构建方法论方面的研究,刘凤华、朱欣娟等人提出了基于需求分解的本体模型构建方法,该方法在构筑面向应用的领域本体中,将研究用户需求放在首要的位置。李景、苏晓鹭等人提出了构建领域本体的知识工程方法,该方法在确定本体领域范围后,列出领域中所有的重要术语,再利用叙词表和学科分类等已有资源,来定义类和类的层次结构,进而形成一定的语义关联,再定义类的属性插件和插件分面,最后创建类的实例。王洪伟、吴家春、蒋馥提出了基于描述逻辑的本体模型。王昕、熊光楞提出了一种基于本体的设计原理信息提取方法。佘青、金可音提出了螺旋模型的原型法本体构建方法等。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈