首页 理论教育 基于引用关系重要性的知识聚合优化方案

基于引用关系重要性的知识聚合优化方案

时间:2023-07-08 理论教育 版权反馈
【摘要】:图5-11是利用引用关系对相对重要性的多元计量聚合可视化结果图。以上的这些结果表明,利用引用关系的重要性进行的相对值聚合的效果相较于利用文献重要性实施的聚合结果更加全面且准确。图5-11基于引用关系相对重要性的多元计量聚合结果可视化表5-733个聚合所涉及的子领域Web服务表5-8列出了该子领域包含的6个文献聚合及其语义主题分布,分别是聚合1、聚合2、聚合4、聚合6、聚合7和聚合14。

基于引用关系重要性的知识聚合优化方案

图5-11是利用引用关系对相对重要性的多元计量聚合可视化结果图。由526对引用关系所连接起来的323篇文献构成了33个不同规模的聚合,具体结果见附录3。由于单独分析具体的某一对引用关系对于用户而言可能作用不是特别明显,而每一个引用关系都包含了两篇文献,即一篇被引文献和一篇施引文献,因此,对于每一个引用关系聚合而言,同样需要从文献的角度出发分析其内容。结合语义分析结果和聚合中主题语义的权重计算,可以揭示每个聚合所反映的知识内容。

通过初步的对比发现,同样是利用相对值聚合方法,从引用关系实施的聚合结果包含了直接从文献角度实施的聚合结果,利用文献重要性实施的相对聚合中的96.8%(155篇)的文献被包含在从引用关系角度实施的相对值聚合中,且所有的主题均被包含。进一步从内容上看,可以发现从文献重要性角度实施的相对值聚合结果中,规模最大的聚合14“data dependency/information retrieval from XML and relational database”在利用引用关系实施的相对值聚合结果中分成了两个部分。以上的这些结果表明,利用引用关系的重要性进行的相对值聚合的效果相较于利用文献重要性实施的聚合结果更加全面且准确。

为了更好地分析结果,可以从总体上将33个聚合大致归入7个大的研究子领域,如表5-7所示:Web服务(Web Services),XML编码与语义表达(XML coding and semantic representation),XML文档处理(Document processing),跨领域应用(Interdisciplinary applications),数据交换与交互(Data exchange),数据库和XML(Database and XML),XML和信息检索(XML and information retrieval)。

图5-11 基于引用关系相对重要性的多元计量聚合结果可视化

表5-7 33个聚合所涉及的子领域

(1)Web服务

表5-8列出了该子领域包含的6个文献聚合及其语义主题分布,分别是聚合1、聚合2、聚合4、聚合6、聚合7和聚合14。这个子领域的所有文献聚合都可以在基于文献重要性的相对值聚合结果中找到。其中聚合1主要侧重于基于Web服务描述语言的服务测试;聚合2、聚合7和聚合14主要是关于移动环境下的Web服务,例如聚合2是关于服务发现协议的,聚合7是关于移动网络服务的框架架构问题的研究,聚合14是关于移动环境下Web服务中XML数据的序列化问题。聚合4与基于XML的分布式管理相关,聚合6则主要针对基于网络的制造信息集成,这两个内容和前面4个聚合略有不同,两者都与分布式环境下的信息集成和数据融合有关,属于Web服务的内容管理

表5-8 Web Service子领域的聚合及其语义主题分布

(2)XML编码与语义表达

表5-9列出了该子领域包含的6个文献聚合及其语义主题分布,分别是聚合5、聚合9、聚合13、聚合19、聚合20和聚合25。前4个聚合在XML编码与压缩技术、语义网、XML组织、正则语言等几个主题上都有明显的交叉。聚合5是关于基于XML编码的语音语料库研究,特别是一个名为NITE XML的工具包,该工具包是处理多模语言数据的软件系统。聚合13中的文献主要是利用XML进行编程语言的编码,例如Java代码的编码等;聚合20是结构化文档合并问题的研究,主要是XML文档的压缩问题;聚合25则是XML进行编码后通过属性结构进行传输的问题。聚合9和聚合19与前4个聚合略有不同,虽然也是主要与XML编码和语义表达相关,但突出了概念模型,聚合9是关于基于XML的系统相似性数据编码的研究,这些研究主要将XML应用于物理仿真系统当中;聚合29中的研究内容是关于程序逻辑设计和程序功能设计的概念研究,例如XML查询语言编码的格式标准和概念模型。

表5-9 XML编码与语义表达子领域的聚合及其语义主题分布

续表

(3)XML文档处理

表5-10列出了该子领域包含的5个文献聚合及其语义主题分布,分别是聚合16、聚合17、聚合21、聚合22和聚合28。这几个聚合中语义主题XML文档呈现结构占的比重都很高,此外,在XML格式标准、XML结构与元素组织、访问控制上也都有交叉。从内容上看,聚合16主要针对利用结构相似性方法进行XML文档的聚类问题,聚合17是关于XML文档中数据压缩的不同类型方法的研究,聚合21则是关于XML文档数据处理的存取控制和安全问题的研究,聚合22则是关于包含时间信息的XML文档的呈现与访问控制,聚合28则是XML文档不同类型的schemas一致性问题的研究。

表5-10 XML文档处理子领域的聚合及其语义主题分布

续表

(www.xing528.com)

(4)跨领域应用

一般而言,XML的相关研究总是和计算机以及网络相关的,然而,随着数字化的不断推进,其应用面实际上已经非常广泛,跨领域应用这个子领域其特征非常明显,表5-11列出了该子领域包含的4个文献聚合及其语义主题分布,分别是聚合12、聚合23、聚合30和聚合31。这4个聚合中包含了生物信息学、医学信息交互等独特的语义主题,很容易被识别出来。其中,聚合12是适用于植物分类研究数据的标记语言,聚合23是关于热力物理学属性数据的存储和交互,聚合30是关于生物医学数据的交换,聚合31则是医学数据交互的内容。总体来看,XML在跨领域的应用主要是用来进行特定学科的数据表达、存储和交互。

表5-11 跨领域应用子领域的聚合及其语义主题分布

(5)数据交换与交互

表5-12列出了该子领域包含的3个文献聚合及其语义主题分布,分别是聚合3、聚合8和聚合10。聚合3主要的研究内容是网络集成环境下数据交互的通用信息模型;聚合8则是基于XML的技术交流内容复用,涉及视频、音频数据的交互和传递;聚合10的研究内容主要是基于XML的多媒体数据描述问题,特别是食品数据的编码和传输问题。

表5-12 数据交换与交互子领域的聚合及其语义主题分布

续表

(6)数据库与XML

表5-13列出了该子领域包含的3个文献聚合及其语义主题分布。该子领域包含了3个文献聚合,分别是聚合26、聚合27和聚合33。虽然包含的聚合数量不是很多,但聚合中的文献数量较多,特别是聚合33,其中有34篇文献,占到了所有论文数量的10%。聚合33的主题为数据库理论,该聚合的规模在所有的文献聚合中属于第二,其中的24篇与基于文献重要性的相对值聚合结果中的聚合14有交叉,所有的论文都关注数据依赖问题,但内容更加详尽。聚合26中的文献主要是关于数据仓库的研究,例如数据仓库集成与XML数据仓库模型等内容。聚合27中的研究主要集中在XML数据库并发处理的协议问题上。

表5-13 数据库与XML子领域的聚合及其语义主题分布

续表

(7)XML和信息检索

表5-14列出了该子领域包含的6个文献聚合及其语义主题分布。聚合32中,关于如何在XML和关系数据库中实施信息检索是最大的研究主题,包含了45篇文献,而其中有21篇与基于文献重要性的相对聚合结果中的聚合14相交叉,这个聚合中的文献讨论了存储、索引、检索数据位中心的XML和以文档为中心的XML、元素检索方法、XML全文检索、XML检索语言、XML查询处理、XML文档计分和排序等内容。此外,聚合11中的研究内容主要针对结构性文档检索和工程信息管理问题,聚合15中的内容主要是关于点对点(ad-hoc)检索中的概率模型问题,聚合18主要和XML检索评价相关,聚合24则与XML检索查询语言相关。

表5-14 XML和信息检索子领域的聚合及其语义主题分布

续表

以上的这些研究基本上构成了整个XML研究发展历史过程中的总体情况。对于这些子领域来说,XML信息检索和数据库的研究包含了数量最多、重要性程度最高的一批文献,这说明这两个领域是整个XML发展过程中最核心的研究内容。XML编码、数据模型和数据交互这些聚合中包含的文献的重要性程度不是很高,但主题的涉及面非常广泛,这表明这些研究领域是XML发展过程中最基础的研究,因为基础研究往往获得巨大的突破较慢,但相对的研究内容却包含方方面面。Web服务是XML的一个重要应用领域和研究防线,虽然其他许多聚合的研究内容或多或少与网络服务相关,但本研究中提到的几个聚合是与Web服务直接相关的一些研究。而跨学科应用子领域则包含了相对比较独特的一些领域,这些领域的研究在整个XML发展过程中相对独立,与其他部分的研究内容不是特别相关,且大多数是关于基于XML格式的数据存储和数据交换,但是这些研究正说明了XML拥有广泛的应用潜力。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈