首页 理论教育 图书馆管理与服务:数字图书馆资源聚合模型特征

图书馆管理与服务:数字图书馆资源聚合模型特征

时间:2023-08-04 理论教育 版权反馈
【摘要】:数字图书馆资源聚合是解决数字图书馆资源孤岛、数字图书馆资源超载等问题,促进数字图书馆资源有效获取和共建共享的有效途径。数字图书馆资源聚合过程中,我们可根据数字图书馆资源组织体系的特点,选择相应的聚合方法。数字图书馆资源聚合研究初期,聚合的维度往往采取单一的视角,即选用某一种资源组织方法描述数字图书馆资源的载体特征。

图书馆管理与服务:数字图书馆资源聚合模型特征

数字图书馆资源聚合是解决数字图书馆资源孤岛、数字图书馆资源超载等问题,促进数字图书馆资源有效获取和共建共享的有效途径。本文通过对国内学者在长期的探索实践中逐渐形成的“数字图书馆资源聚合”模式进行总结,认为数字图书馆资源聚合模型具有以下几点特征:

(一)数字图书馆资源聚合对象的多元化

将资源进行描述与组织是数字图书馆资源聚合的基础,对不同种类的资源使用不同的组织与描述方式,也导致了不同层次的聚合方法与方式。数字图书馆资源的描述方式一般包括两种:数字图书馆资源的外部特征以及数字图书馆资源的内部特征。数字图书馆资源的外部特征也可以称为外部属性,例如分类词表、主题词表、著录法或元数据。描述的内容包括题名、资源标识、资源类型、资源格式、创建者以及出版者等。数字图书馆资源的内部属性主要包括资源的关键词、分类号、摘要以及标题等能够反映资源主题的特征。

事先设定好一个能反映数字图书馆资源知识结构的分类体系,从数字图书馆资源中抽取出特征项元数据后,通过对数字图书馆资源外部特征的聚合,将数字图书馆资源映射与集成到相应的分类体系之下,可以实现数字图书馆资源体系的有机统一。从数字图书馆资源的内部特征数据集出发,利用关键词或主题等内部特征,在数字图书馆资源聚合模型中应用聚类方法,可以有效对数字图书馆资源聚合。与数字图书馆资源外部特征的聚合不同,数字图书馆资源内部特征的聚合不需要事先设定知识结构分类体系,而是利用聚类理念使数字图书馆资源呈现出集簇状,同一文献簇资源彼此相似和关联,不同簇资源尽量不相似不关联,进而根据数字图书馆资源呈现出的层次簇状结构为之选择一种或多种合适的表示结构,并以可视化的方式为用户呈现出来。从外部特征到内部特征的聚合,体现了数字图书馆资源对象的多样性,使得数字图书馆资源聚合体系中知识结构变得更加灵活,用语义关系揭示的概念颗粒度越来越精细,这也标志着数字图书馆资源聚合“思路”的重大转变。

(二)数字图书馆资源聚合方法的多样化

经过众多学者对于聚合的深入研究,聚合的理论基础己经奠定,并且随着人工智能技术的发展,语义网技术的规范以及分众分类法、计量学和关联数据在数字图书馆建设中的大量应用,数字图书馆资源再组织粒度的不断细化,聚合的研究方法也已经呈现出多重发展的态势。

数字图书馆资源聚合过程中,我们可根据数字图书馆资源组织体系的特点,选择相应的聚合方法。例如,将数字图书馆资源以及其形成的关系视为一个知识网络,其中每个资源都可以视为一个节点,而资源之间的关联关系可以视为边,那么聚合就可以表述为利用复杂网络理论及分析方法的方法进行社区发现;如果文献计量学中的直接分析对象为馆藏文献资源及其关系,那么可以应用聚类方法对文献资源的特征对象进行检索或数据挖掘;基于本体论,获取馆藏文献资源的实例信息,通过概念、概念关系与属性关系等进行语义推理等进行聚合,可以揭示馆藏文献资源之间的关联关系。另外还有主题图中主题、关联和显现三要素进行聚合以及利用主题法的属分关系进行聚合等等。目前研究较热的复杂网络理论及分析方法,与计量学理论和方法融合后,为数字图书馆资源聚合语义化提供了新兴手段。数字图书馆资源聚合方法,就是通过对数字图书馆资源各个特征的描述,利用各种形式的聚类模型和聚类技术,揭示出数字图书馆资源之间明显的语义关系,并挖掘出数字图书馆资源之间潜在的语义关系。这些语义关系即是聚合后的结果,因此聚合的实质也是知识的聚合,为了更好的利用这些知识,必须通过可视化的过程呈现并提供给用户。如利用形式概念分析、层次信息可视化、标签聚类等方法发现数字图书馆资源内容蕴含的语义:利用计量分析和复杂网络理论及分析方法等方式发现数字图书馆资源蕴含的关联语义等。从数字图书馆资源聚合到可视化呈现,不仅能识别数字图书馆资源的不同主题、不同外延内涵以及不同属性关系的知识内容,也可以可视化的方式将挖掘出的数字图书馆资源隐含的语义关系呈现给用户,大大提高了数字图书馆资源利用的效率。(www.xing528.com)

(三)数字图书馆资源聚合维度的立体化

立体化是指数字图书馆资源聚合模式发展中,用于刻画数字图书馆资源再组织的维度呈现出立体化的知识网络。数字图书馆资源聚合研究初期,聚合的维度往往采取单一的视角,即选用某一种资源组织方法描述数字图书馆资源的载体特征。而随着研究的深入,数字图书馆资源聚合维度己经开始关注对数字图书馆资源进行语义标注,通过聚合发现数字图书馆资源之间的关联关系等,聚合的结果将数字图书馆资源之间实体与关系以知识网络的形式进行呈现。

数字图书馆资源聚合的维度大致可分为两类:一类是基于内部特征聚合的数字图书馆资源语义挖掘,包括概念关系分析、本体构建等多种途径,通过内部特征聚合实现概念的语义网络;另一类是基于外部特征聚合的数字图书馆资源关联发现,利用计量学理论和方法为包括机构关联发现、学者关联发现、期刊关联发现、主题关联发现、文献关联发现和交叉关联发现等构建多种关联网络,数字图书馆资源语义化提供的不仅仅是语义化对象,还提供了定量概念关系的确切方法和手段,为概念关系深度和数字图书馆资源聚合提供了量化支撑。数字图书馆资源聚合维度的立体化,表明了数字图书馆资源聚合维度可以满足用户不同的资源再组织需求,拓宽了传统意义上资源再组织的视角,标志着数字图书馆资源再组织“视角”的不断拓展。

(四)数字图书馆资源聚合过程的动态

聚合过程的动态化表现为资源语义化过程的动态性。数字图书馆资源的语义化过程首先需要提取资源内部的语义知识特征,从而选定表征新资源的组织体系,创建标准元数据或者集成数据源对资源特征的语义描述,这也是进行资源语义标注过程。在这个过程中,可以加入新的数据源或者更换数字图书馆资源再组织的方式,这也是数字图书馆资源动态的再组织过程。另外,聚合过程的动态性也体现在在数字图书馆资源聚合形成一定的聚合网络或者聚类结构过程的动态性。在知识聚合网络中,知识间的链接关系得以充分的体现。其中,传统的学科主题知识一般会形成链接紧密的知识团块,但新兴的交叉学科主题也会形成分散但不离散的知识群落。群落规模的扩大、相邻群落的合并,以及群落间距离的变化等是群中知识的传递与扩散过程,这也可以在一定程度上反映出聚合过程的动态性。在聚合网络形成的知识群落中,对数字图书馆中知识模块与知识群落的凝聚状况分析与聚合程度进行研究,从中可以识别出传统学科与新兴学科、成熟知识与新生知识、封闭主题与开放主题等一系列模式与特征。数字图书馆资源聚合过程的动态化,使得数字图书馆资源新体系能够不断根据外部环境的需求对数字图书馆资源在组织体系方面做出相应的动态调整,提高了数字图书馆资源再组织的应变性和适应性。

数字图书馆资源聚合这种再组织模式最终会采用知识组织体系来完成对数字图书馆资源的再组织,而各类知识组织体系都是通过概念实现不同的知识组织目的。数字图书馆资源再组织模式发展中,资源再组织理论呈现出愈发完备和成熟的理论体系。数字图书馆资源聚合满足新环境下数字图书馆资源再组织需求的新理论,随着后续研究的不断深入,该理论体系还会被不断丰富和完善。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈