首页 理论教育 图情大数据:图书馆信息资源管理结果

图情大数据:图书馆信息资源管理结果

时间:2023-08-08 理论教育 版权反馈
【摘要】:图书馆一直致力于为各种类型的用户收集、存储、组织和保存信息,并提供对信息资源的访问。为此,图书馆通过应用研究开发了信息检索系统、知识组织系统和元数据标准等,以支持各个方面的信息资源管理。如今,图书馆越来越向信息科学靠拢。然而,关于图书馆与情报科学的学术讨论以及两者的融合一直在进行中,尚未达成共识。Buckland的立场与图情研究中的一条传统思路有关,该思路主要通过文献或文献处理来考虑信息的重要性。

图情大数据:图书馆信息资源管理结果

图书馆一直致力于为各种类型的用户收集、存储、组织和保存信息,并提供对信息资源的访问。为此,图书馆通过应用研究开发了信息检索系统、知识组织系统和元数据标准等,以支持各个方面的信息资源管理。如今,图书馆越来越向信息科学靠拢。在学科领域图书馆学逐渐被信息科学(information science)或图书馆与情报科学(library and information science)等组合术语所代替。从某种意义上说,它已经超越了传统的图书馆资源,在迎接数据管理和信息的挑战中,接纳了本地或全球的私人和公共信息环境中的各种用户和各种知识。然而,关于图书馆与情报科学的学术讨论以及两者的融合一直在进行中,尚未达成共识。

图书馆与情报科学被放置在技术、社会科学和人文科学的交汇处,它通常关注以下几个方面:

①主题分析(人工和自动分类和索引,社会标签)。

书目分析(目录编制,元数据结构)。

③社会分析(对线上线下各个社区的信息、文献和知识,如图书馆和信息实践的社会和体制结构的分析)。

④与认知有关的分析(信息行为)。

这种丰富的学科结构所产生的研究问题和理论命题的广度引起了学术界对学科研究重点、研究方法以及学科总体地位的不断讨论。瑞典布洛斯大学图书馆与情报科学的Nolin教授和Åström教授认为,图书馆与情报科学尽管出现了不同的问题领域和理论立场,使该学科看上去既狭窄又多样化,但还是表现出学科力量的特征。他们指出了图书情报学与跨学科性有限的传统强学科相比的三个主要优势:

①图书情报学在信息跨学科研究方面具有悠久的传统。随着社会发展,信息结构和研究的复杂性日益增加,学科没有偏向“锁定”其传统的理论和方法研究。

②图书情报学通常与其他学科(例如计算机科学、教育学和心理学)中的信息研究紧密相关。这使学科研究人员能够为各个领域的进步做出贡献。

③图书情报学具有强烈的自我反思传统。有时这会被视为一个学科弱点,但在当代社会中,它必须被认为是一种优势,因为它使该学科能够以富有战略意义的方式解决其主要问题。

美国著名的图书馆学和情报学家Buckland提出过一个问题:“图书情报学能成为什么样的学科?”Buckland得出的结论是图书情报学首先关注文化参与(cultural engagement),他指出,图情领域的“正式和定量方法非常有价值,但领域本身就是不可侵犯的文化”。“正式和定量的方法”在这里是指文献计量学和信息检索,这里的意思是尽管图情研究人员乐于从事此类领域,但他们很少涉及对技术本身的研究,而是利用各种技术如系统、应用程序和解决方案来实现价值。(www.xing528.com)

Buckland的立场与图情研究中的一条传统思路有关,该思路主要通过文献或文献处理来考虑信息的重要性。而且,在有文献的地方也有数据,例如两者都与“事实”具有复杂的关系。数据或文献和信息之间的区别很复杂,而文献和数据之间的差异很容易通过证明文献和数据能否作为信息的载体而得到解决。因此,对于图情领域而言,数据并不是什么新鲜事物。然而,该学科与大多数学科的区别是,图书情报学中的数据不仅被视为经验工作的结果或用于统计分析的原材料,而且被视为研究对象本身。

在图情领域,数据通常被放置在数据—信息—知识—智慧的金字塔结构(图1-1)中,其中,信息被定义为有助于分析和理解某种现象并以某种方式构造的数据。其实,早前Buckland就以类似的方式讨论过数据的位置。Buckl and将信息定义为以下三个方面:①信息即知识(information-as-knowledge),②信息即事物(information-as-thing),③信息即过程(information-as-process)。数据、文献和记录的知识都可以归为第二类“信息即事物”。在这种情况下,数据就被定义为已经以某种方式进行了处理以供使用的“信息即事物”。

图1-1 数据—信息—知识—智慧的金字塔

在这样的知识环境中,“大数据”基本上不过是对已经众所周知的研究对象的定量扩展。在图情领域,传统的信息资源管理可以分为文献保管、文献共享和文献计量三个方面。

1)文献保管

文献保管是图书馆最基本的职能之一,一般包括文献的收集、整理、典藏和服务四个部分。文献收集是整个图书馆工作的基础。图书馆馆员首先要明确本馆的收藏原则、收藏范围、收藏重点和采选标准,了解本馆馆藏情况、文献的种类与复本数、各类藏书的利用率和使用寿命,了解哪些书刊可剔除、哪些书刊要补缺等,此外还需掌握出版发行动态,然后以采购、交换和复制等各种方式补充馆藏。文献整理包括文献的分类、主题标引、著录和目录组织等内容。文献分类不仅为编制分类目录和文献排架提供依据,也用于图书馆统计、新书宣传、参考咨询和文献检索等。文献主题标引是根据文献内容所讨论的主题范围,以主题词来揭示和组织文献的。文献分类和主题标引是揭示文献内容的重要手段,文献著录则是全面地、详尽地揭示文献形式特征和内容特征的主要手段,它便于读者依据该文献的各种特征确认某种文献,获得所需文献的线索。图书馆馆员把各种款目有序地组织成图书馆目录以揭示图书馆馆藏。图书馆目录是检索文献的工具,也是打开图书馆这个知识宝库的钥匙。文献典藏主要包括书库划分、图书排列、馆藏清点和文献保护等。其中,文献保护是一项专门技术,包括图书装订、修补、防火、防潮、防光、防霉和防虫,以及防止机械性损伤等。图书馆服务是一项开发利用图书馆资源的工作,它包括发展读者(如发放借书证)、读者研究、文献流通和推广服务(包括文献外借、阅览服务、文献复制、馆际互借、流动图书馆等)、馆藏报道、阅读辅导、参考咨询和文献检索、读者教育等。

2)文献共享

文献共享并不是一个新的研究领域,至少从20世纪60年代中期开始,不断增长的网络数据影响就一直是学术交流讨论的一部分。这时,数据的重要性被嵌入图情领域的优先问题中,以开发用于组织学术交流网络的科学方法,该方法在科学出版物的参考文献中得以展示。这样,人们对数据本身的兴趣逐渐从文献计量学的重点转向出版物。自20世纪80年代中期以来,人们对各种规模和速度的数据产生了更为明确的兴趣,当时有关数据共享的第一本主要选集以美国政府对此问题的报告的形式出现。在当今的网络学术环境中,数据和出版物之间作为分析实体的出版物之间越来越不明显的差异导致了有关数据的问题;传统上用于出版物发布、引文模式、科学影响和研究评估有着相同的问题:电子化文献的广泛可用性不仅使大型数据集的网络分析成为可能,而且使基于文献计量研究的网络分析成为可能。

3)文献计量

文献计量学是图情领域研究的一个重要分支,文献计量学中的定量方法和定律,是图情业务开展的工具和必要手段。文献计量学作为一个科学领域出现于20世纪60年代,当时E.Garfield创立了“科学引文索引(science citation index)”数据库,该数据库涵盖了科学领域的论文和作者等信息。随着网络研究环境的出现,文献计量学得到发展,现在被划分为网络计量学、信息计量学和替代计量学三个紧密相关的子领域,用以分析数字文档和数据集的统计模式。网络计量学使用了来自文献计量学并与之相似的引文分析、词频分析和共词分析原理,但已应用于网络,特别是在可以将网络视为学术文档的大型数据库的级别上。这里特别引人关注的是替代计量学,它是从对统计分析、参考文献和引文的传统书目基础的不足感发展而来的。在网络环境中,出版物和开放数据之间的界线因基于数字的可用性(例如社交媒体和博客)而变得模糊,事实证明,对新分析方法和活动的需求是必要的。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈