首页 理论教育 了解知识图谱:提升搜索引擎和用户体验

了解知识图谱:提升搜索引擎和用户体验

时间:2023-06-23 理论教育 版权反馈
【摘要】:知识图谱的目的是提高搜索引擎的能力,改善用户的搜索质量及搜索体验。目前,知识图谱还没有一个标准的定义。知识图谱由一条条知识组成,每条知识表示为一个SPO,即主-谓-宾三元组,如图2-47所示。图2-46知识图谱示例构成知识图谱的核心是三元组,三元组是由实体、属性和关系组成的。

了解知识图谱:提升搜索引擎和用户体验

1.知识图谱的提出

1989年,万维网出现,为知识的获取提供了极大的方便。2006年,蒂姆·伯纳斯-李(Tim Berners-Lee)提出链接数据的概念,希望建立起数据之间的链接,从而形成一张巨大的数据网。谷歌公司为了利用网络多源数据构建的知识库来增强语义搜索,提升搜索引擎返回的答案质量和用户查询的效率,于2012年5月16日首先发布了知识图谱,这标志着知识图谱的正式诞生。

知识图谱的目的是提高搜索引擎的能力,改善用户的搜索质量及搜索体验。随着人工智能技术的发展和应用,知识图谱作为关键技术之一已被广泛应用于智能搜索、智能问答、个性化推荐、内容分发等领域。现在的知识图谱已被用来泛指各种大规模的知识库,谷歌、百度搜狗等公司为了改进搜索质量,纷纷构建自己的知识图谱,分别称为知识图谱(图2-45)、知心和知立方。

图2-45 百度知识图谱

2.知识图谱的定义

知识图谱以结构化的形式描述客观世界中概念间和实体间的复杂关系,将互联网的信息表达成更接近人类认知模式的形式,提供了一种更好的组织、管理和理解互联网海量信息的方式。它把复杂的知识领域通过数据挖掘、信息处理、知识计量和图形绘制等技术显示出来,以揭示知识领域的动态发展规律。

目前,知识图谱还没有一个标准的定义。简单地说,知识图谱是由一些相互连接的实体及其属性构成的。也可以将知识图谱看作是一种基于图的数据结构,由节点(Point)和边(Edge)组成,每个节点表示一个“实体/概念”,每条边为实体与实体之间的“关系/属性”。图2-46所示是一个典型的知识图谱,图中的顶点表示实体或概念,而图中的边则表示属性或关系。

知识图谱的组成三要素包括实体、关系和属性。

①实体:又叫作本体(Ontology),是知识图谱中最基本的元素,具有可区别性且客观、独立存在的某种事物,可以是具体的人、事、物,也可以是抽象的概念或联系。例如中国、美国、日本等,又如某个人、某个城市、某种植物、某种商品等。

②关系:知识图谱中,边表示知识图谱中的关系,用来表示不同实体间的某种联系。(www.xing528.com)

③属性:知识图谱中的实体和关系都可以有各自的属性。

3.知识图谱的表示

图2-46 知识图谱示例

构成知识图谱的核心是元组,三元组是由实体、属性和关系组成的(由Entity、Attribute、Relation组成)。三元组是知识图谱的一种通用表示方式,如图2-47所示,基本形式主要有两种:

①(实体1-关系-实体2):(中国-首都-北京)是一个(实体1-关系-实体2)的三元组样例。

②(实体-属性-属性值):北京是一个实体,人口是一种属性,2 189万人是属性值。(北京-人口-2 189万人)是一个(实体-属性-属性值)的三元组样例。

知识图谱由一条条知识组成,每条知识表示为一个SPO(Subject-Predicate-Object),即主-谓-宾三元组,如图2-47所示。

图2-47 SPO三元组

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈