首页 理论教育 科学知识多元计量聚合的研究对信息检索与知识计量发展具有重要推动作用

科学知识多元计量聚合的研究对信息检索与知识计量发展具有重要推动作用

时间:2023-07-08 理论教育 版权反馈
【摘要】:对于科学知识多元计量聚合的研究将有利于解决信息检索中面临的问题,同时也拓展信息计量研究的应用领域,推动信息计量向知识计量方向的发展。针对传统研究中从局部角度进行重要性评价,本研究认为全局角度的重要性评价更能反映资源真实的重要程度。实现了多类作者知识关联网络的多元计量聚合通过关联性问题的研究,为目前广泛使用的各种共现网络分析方法的选择提供了更多的理论和实践证据支持。

科学知识多元计量聚合的研究对信息检索与知识计量发展具有重要推动作用

本书是在知识经济不断发展、国家文化事业不断繁荣、图书情报学知识化程度不断加深和技术融合不断加速的背景下提出的一项理论、方法与应用相结合的研究。文章将信息计量、自然语言处理、社会网络与复杂网络分析、多元统计分析、语义挖掘等领域的理论与方法综合运用,明确了科学知识多元计量聚合的理论定位,构建了科学知识多元计量聚合的理论体系,提出了实现多元计量聚合的关键技术组成,并以XML研究领域为例进行实证研究,力求实现面向科学文献的科学知识多维度、多粒度、多层次的计量聚合。本研究的主要研究结论如下:

(1)系统梳理了科学文献资源聚合的相关理论成果,并创新地提出了多元计量聚合的理论定位是衔接信息计量和信息检索的纽带

多元计量聚合的对象是数字化的科学文献资源,其知识性是聚合研究的基本出发点;数字资源整合是知识资源多元计量聚合的前阶段,也是聚合研究的基础之一;信息搜寻和信息检索是与科学知识多元计量聚合研究最相关的领域之一,从用户的角度出发提供最有价值的资源集是信息检索和知识聚合的共同目标;信息计量学中以幂律形式存在的集中与离散分布是能够实现知识资源多元计量聚合的基础。对于科学知识多元计量聚合的研究将有利于解决信息检索中面临的问题,同时也拓展信息计量研究的应用领域,推动信息计量向知识计量方向的发展。

(2)明确科学知识多元计量聚合的内涵,构建了科学知识多元计量聚合的理论框架

多元计量聚合本质上是用户和以资源集合为表现形式的知识世界的交互过程;科学知识多元计量聚合的理论模型包括聚合的对象类型、关联网络、测度方法和聚合目的四个要素,这些要素的多元性特征体现了科学知识资源聚合的多元性。科学知识聚合从基于元数据的聚合、基于计量的聚合到基于语义的聚合是一个不断深化的过程,其中包含了多粒度的深度层次。依据不同特征项进行的聚合深度特征不同,词角度的聚合侧重于语义发现,是实现语义揭示的基础;引文角度的聚合侧重于发现核心资源聚合,而作者角度的聚合除了资源聚合的语义发现,还包括不同类型网络之间的语义关联分析。理论框架的建立为进一步构建技术流程框架提供了理论基础。

(3)设计了科学知识多元计量聚合的技术流程和应用框架(www.xing528.com)

其应用框架可归纳为三个主要内容:聚合对象(资源及其包含的特征项实体)的重要性评价、资源聚合的获取、资源聚合的语义内涵揭示三个部分。这种架构方式一方面考虑了科学文献资源本身的特点,另一方面也综合考虑了资源及其特征项在关联网络中的结构性特征。针对传统研究中从局部角度进行重要性评价,本研究认为全局角度的重要性评价更能反映资源真实的重要程度。针对基于节点和基于聚类的两种现有的聚合方法,创新地提出了规模角度的相对重要性聚合算法用于发现核心资源集合。总结了信息检索中词权重确定思想,计量分析中共词语义分析,再到利用主题模型进行语义分析的深层次挖掘过程,认为与传统从组织角度实施的语义技术如本体等相比,主题语义挖掘具有更好的灵活性和可操作性。

(4)实现了引文网络中核心资源的多元计量聚合

研究分析局部引文分析和全局引文分析,归纳了传统引文网络中的问题,例如重要性评价单一、结构分析粒度过大的问题,将多元计量聚合技术流程应用于引文网络中,并发现与传统的聚类和社区发现方法相比,相对值聚合方法在引文网络中的适用性很强,并且能够揭示整个网络中最具层次丰富性的核心知识资源聚合。结合主题语义分析的结果,可以对聚合中所包含的语义内容进行深度的揭示,从而反映客观、真实的知识内容。利用相对值聚合方法对引文网络实施聚合的另一个重要意义在于,聚合发现的结果不再仅集中于少数特别突出的研究主题,相对重要性聚合算法能够挖掘在主题整体发展过程中某个时间段上的重要子领域,这是本书所构建的理论和方法体系有效性的重要体现。

(5)实现了多类作者知识关联网络的多元计量聚合

通过关联性问题的研究,为目前广泛使用的各种共现网络分析方法的选择提供了更多的理论和实践证据支持。利用加入作者的语义主题模型能够挖掘出作者的主题语义分布,在从聚类到聚合的提升过程中,不再仅仅依赖于分析者本人的判断,为语义聚合提供了保障。通过对作者合作、互引、共被引、基于文献的耦合、基于关键词的耦合和基于出版物的耦合六种关联网络分析发现,作者合作网络、共被引网络、基于文献的耦合网络的聚合均有其独特之处,而互引、基于关键词的耦合、基于出版物的耦合则有许多使用上的限制。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈