首页 理论教育 FrameNet知识库:短文本表示与应用

FrameNet知识库:短文本表示与应用

时间:2023-11-18 理论教育 版权反馈
【摘要】:FrameNet知识库是一个大规模英语词语数据库,并注释词语在实际文本中的用法示例,为英语词语的核心组合特性提供了独特的详细证据。在FrameNet中,“框架”作为一个语言学术语,是指人们在理解自然语言时激活的大脑中已有的认知结构,是用于描述一个事件或一个语义场景的一组概念。

FrameNet知识库:短文本表示与应用

FrameNet知识库(简称“FrameNet”)是一个大规模英语词语数据库,并注释词语在实际文本中的用法示例,为英语词语的核心组合特性提供了独特的详细证据。自1997年以来,该项目一直在伯克利的国际计算机科学研究所(International Computer Science Institute)运作,主要由美国国家科学基金会(National Science Foundation)提供支持。从学生的角度来看,这是一本包含13 000多个词义的词典,其中大部分都附有注释,说明词义和用法;对于自然语言处理领域的研究人员来说,这超过20万个手工标注的句子链接了超过1200个语义框架,为科研工作提供了一个独特的语义角色标注训练数据集,可将其用于信息提取、机器翻译、事件识别、情感分析等应用。

FrameNet是基于框架语义(Frame Semantics)的词汇资源。框架语义学是研究词语意义和句法结构意义的一种理论方法,即试图以真实语料为基础,以经验主义方法寻找语言和人类经验之间的紧密关系,并研究一种可行的描述方式来表示这种关系。在FrameNet中,“框架”作为一个语言学术语,是指人们在理解自然语言时激活的大脑中已有的认知结构,是用于描述一个事件或一个语义场景的一组概念。每个框架都包含一系列被称为框架元素的语义角色。在现实语料中,框架元素与语境中描述事件或事物形态的词汇相对应。框架元素按照重要程度又被分为核心框架元素和非核心框架元素。不同的框架在框架元素的种类和数量上是有差别的,这些具有个性特征的框架元素更适合用来描述自然语言中千变万化的语义信息。

框架关系(Frame-to-Frame Relations)是用来描述两个框架之间的语义关系的一个概念,是两个框架之间的一种定向(非对称)关系。FrameNet知识库定义了8种框架关系:继承(Inheritance)、透视(Perspective_On)、总分(Subframe)、先后(Precedes)、起始(Inchoative_Of)、致使(Causative_Of)、使用(Using)、参阅(See_Also)。每个框架关系都直接关联两个框架,根据定向关系,一个叫作父框架(Super_Frame),另一个叫作子框架(Sub_Frame)。不同框架的框架元素也依据框架关系相互映射在一起。这8种框架关系的定义及说明如下[69]

继承关系:汉语框架关系中的继承关系与本体关系中的关系非常相似,用于表示上位框架的框架元素、分框架以及语义类型都被下位框架继承或具体化。在这种关系下,任何一个对于父框架具有严格的纯粹的语义关系必须对应一个平等的或更加明确的子框架的语义关系。

透视关系:透视关系的使用说明至少存在两种不同于中性框架看法的框架。例如,“商业购买”框架和“商业销售”框架就是在“商业贸易”框架中分别以“买方”和“卖方”这两个不同的透视点出发所激起的框架。根据视角的不同,可以将透视关系分析出若干释义,因此这种关系对于推理是非常有用的。

总分关系:汉语框架网中有一些框架是比较复杂的,这些框架包含一些有序列的场景,而这些场景自身又能被一些框架描述。这些复杂的框架通过总分框架来与它的组成框架部分连接在一起。

先后关系:先后关系描绘了序列场景上的时间顺序的特性,因此它只应用在“事件”场景激起的框架中。例如,在“行为”场景中,“行为开始”框架要先于“行为完成”框架。(www.xing528.com)

起始关系:起始关系表明当前框架代表的行为(或状态)是某些框架描述的行为(或状态)的起点。

致使关系:致使关系表明当前框架代表的行为(或状态)是某些框架描述的行为(或状态)的原因。

使用关系:使用关系表示两个框架之间具有抽象与具体的关系,在框架的层级体系中,概括程度高、抽象的框架一般是背景框架,通常这种高层的抽象框架是一个“被使用的”框架体系,即此框架的内容会在某个方面或多或少地被运用在下层的具体框架中。这时,具体框架与抽象框架之间具有使用关系。

参阅关系:参阅关系用于提醒用户注意与类似概念的区分、比较和对比,不表示有任何概念角色或某种关系。

综合比较国内外各种语义知识资源,FrameNet知识库具有比较明显的优点:能提供数量多、类型丰富的框架元素,较好地突显知识框架的个性,有利于深入地表示丰富的语义信息;具有抽象化的概念逻辑关系,具备推理能力,可以在资源中定义的框架关系(如继承、透视、总分、先后等)的基础上建立基于框架的事件联系和推理机制;能提供丰富的语义标注句子库,为应用于自然语言处理学科各研究领域建立了真实的语料资源。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈