首页 理论教育 文献检索系统:工具及实践应用研究

文献检索系统:工具及实践应用研究

时间:2023-11-30 理论教育 版权反馈
【摘要】:例如 DIALOG,MEDLARS,STN 等联机检索系统。联机检索系统是一个典型的计算机检索系统,能完成数据收集、分析、加工处理、存储、传递通信和检索信息的全过程,由联机服务中心的主计算机、检索终端、通信网络、联机数据库、检索软件等组成。联机检索的特点就是可以不受地理位置影响,在检索过程中可以随时修改检索策略。从广义上说, 局域网内的光盘检索服务和现阶段的国际联机检索也都属于网络信息检索范畴。

文献检索系统:工具及实践应用研究

一、文献检索系统

(一)文献检索系统的概念及类别

信息检索系统是指为满足信息用户的需要,根据特定的信息要求而建立起来的一

种有关信息搜集、加工、存储和检索的程序化系统。简单地说,信息检索系统即信息

存储和检索的系统。 信息检索系统按检索手段可分为手工检索系统和计算机检索系统。

1.手工检索系统

手工检索是一种传统的检索方法,即以手工翻检的方式,利用目录、索引、文摘

等检索工具来查找和获取所需文献的方法。手工检索系统包括书本式目录文摘索引以

及各种卡片(穿孔卡片、元词卡片等) 。手工检索的方法比较简单、灵活,容易掌握。

但是,手工检索费时、费力,特别是进行专题检索和回溯性检索时,需要翻检大量的

检索工具反复查询,花费大量的人力和时间,而且很容易造成误检和漏检。 

2.计算机检索系统

计算机检索系统是借助计算机技术、通信技术、光盘技术、网络技术等信息技术

建立的存储和检索信息的检索方法。检索系统由硬件和软件组成,硬件主要包括计算

机主服务器、检索终端、数据输出设备等。软件主要包括检索程序和数据库等。检索

软件是检索系统的灵魂,负责管理数据库和处理检索提问,它决定系统的检索能力。

数据库是检索系统的信息源和信息存储仓库,是检索作业的对象。

由于计算机检索具有速度快、信息量大、准确性高、代价低廉等特点,因此正在

逐步取代卡片、目录等传统的手工检索方式,成为文献检索的主流。一般大型的综合

图书馆都已经逐步建立起计算机文献检索系统,并提供信息服务。研究者只要在计

算机上输入检索要求,计算机即刻就会列出有关的书目、篇名及其出处。计算机检索

的输入要求可以是 : 作者、书名或篇名、关键词等,其中用关键词检索是最方便、最

常用的检索方式。

计算机检索系统包含以下三种类型。

(1)光盘检索系统

光盘检索系统是以光盘为存储介质,利用光盘驱动器和计算机检索软件,实现对

光盘数据库读取和检索的系统。光盘信息检索服务是利用光盘数据库开展的信息检索

服务。光盘(Compact Disc,简称 CD)是在激光视频录放技术基础上发展起来的光存

储技术,具有信息密度高、成本低、容量大等特点,但由于光盘数据库的更新速度比

较慢,所以光盘检索系统常常作为联机检索系统的补充。

(2)联机检索系统

联机检索系统是指用户利用终端设备(包括检索终端、调制解调器和打印机) ,通

过国际(卫星)通信网络与本地计算机检索系统或远程计算机检索系统的主机联结,

从而检索所需的世界各地存储在计算机数据库中的信息资料的系统。例如 DIALOG,

MEDLARS,STN 等联机检索系统。

联机检索系统是一个典型的计算机检索系统,能完成数据收集、分析、加工处理、

存储、传递通信和检索信息的全过程,由联机服务中心的主计算机、检索终端、通信

网络、联机数据库、检索软件等组成。联机检索的特点就是可以不受地理位置影响,

在检索过程中可以随时修改检索策略。检索结果可以有多种输出方式,但它也存在着

费用昂贵、检索人员必须熟悉不同检索系统的检索语言等缺点。

进入 20 世纪 90 年代后,国际互联网的发展使得联机信息检索向网络信息检索发

展,网络信息检索服务已成为联机检索阶段的延伸。

(3)网络检索系统

网络信息检索系统是通过现代通信网络、利用网络信息检索工具如网络信息浏览

软件和搜索引擎来浏览和检索各种网络上分布的数据库等特定信息的系统。网络检索

系统一般由计算机服务器、用户终端、通信网络、网络数据库等组成,其特点是方法

简单、灵活、方便、时效性强、费用低。

现在,以 www 为代表的网络信息检索系统正以其无可比拟的优越性成为功能最

强、发展最快的一种现代信息检索系统,成为当今信息时代的一个重要标志。从广义

上说, 局域网内的光盘检索服务和现阶段的国际联机检索也都属于网络信息检索范畴

目前,由于局域网内光盘信息检索所存在的要求存储器越来越大的缺点,许多信息服

务机构和出版商都提供了光盘检索数据库的网络版,读者可以通过网络直接在 Web 页

面检索使用供应方服务器上的数据库。 

(二)检索系统的结构要素

无论采用什么手段对何种类型的检索系统进行文献信息检索,其检索系统必须具

备以下四个要素。

1.作用于系统的人

作用于系统的人包括信息用户,信息采集分析、信息标引员,系统管理与维护员,

检索服务人员等。

2.检索文档

检索文档指经过序列化处理并附有检索标识的信息集合。例如,手工检索系统使

用的检索文档是由卡片式目录、文摘、索引所构成的系统 ; 计算机检索系统使用的是

存储在磁性或光性介质上的目录、文摘、索引或全文以及多媒体信息所构成的数据库。

3.检索设备

检索设备指用以存储信息和检索标识,并实现信息检索标识与用户需求特征的比

较、匹配和传送的技术手段,即检索所需的硬件环境。在手工检索系统中检索设备指

印刷型检索工具,在计算机检索系统中包括各种类型的主机、终端、计算机外围设备

和网络通信传输设备。

4.系统规则

系统规则指用以规范信息采集分析、标引著录、组织管理、检索与传输等过程的

各项标准体系,如检索语言、著录规则、检索系统构成与管理、信息传输与控制标准、

输出标准等规则。

二、文献检索工具

(一)检索工具的概念

信息检索工具是指用以报导、存储和查找文献线索的工具。它是附有检索标识的

某一范围文献条目的集合,信息资料被整理、加工后的成果,是信息检索的必备物质

基础,也是检索的有力工具。只有掌握了检索工具,才能便利地实现检索目的。

一般说来,检索工具应具备明确的收录范围 ; 有完整明了的文献特征标识,且每

条文献条目中必须包含有多个有检索意义的文献特征标识,并标明供检索用的标识,

全部条目科学地、按照一定规则组织成为一个有机整体 ; 有索引部分,提供多种必要

的检索途径。

(二)检索工具的主要结构要素

各类检索工具之所以有所区别,主要是组成的要素不同。文献检索工具的主要要

素包括文献检索工具所能揭示的各种各样的文献资源、文献的著录、检索点、检索界

面(接口或索引)和使用说明; 对于计算机文献检索工具而言,还有检索界面的功能、

检索式、检索词的匹配方式、检索结果记录排序方式,以及检索结果记录分析、统计、

下载等要素。

1.文献资源

文献资源是文献检索工具存在的物质基础,一个检索工具中可以有一种或多种类

型的文献线索信息或全文,包括新闻报纸、期刊、专利、学位论文会议论文、产品

信息、标准信息、政策法规、企业信息、图片信息等。所揭示的文献信息的载体或出

版物也多种多样,包括纸质出版物、PDF 文档、图片、视频等。不同的检索工具选择

文献的标准不同,如 SCI 主要选择高质量的学术期刊论文。

不同类型的文献信息具有不同的特征项,其中有些是共同的,如文献名称、作

者、出版日期、来源、语种、作者单位、国家、作者通信地址、联系方式、载体类

型、保存格式等,有些是只有特定的文献才具有的特征项,如图书的国际标准书号

(International Standard Book Number,ISBN) ,期刊或报纸论文还包括出版物的名称、

国际标准刊号(International Standard Serial Number,写为 ISSN)等。

2.检索点及相关术语

不同检索工具的检索点不完全相同,但基本可以分为两类: 内容特征和辅助特征。(www.xing528.com)

内容特征主要指文献名称、关键词、摘要等能表明文献基本内容的特征 ; 辅助特征主

要指出版者、出版日期、标识号等内容特征以外的特征。

有些文献特征常常作为检索的次要条件,如检索“最新的发表在《Nature》上的生

物学领域的文献” ,其中“最新”为次要条件,一般称次要条件为限制条件。常见的限

制检索包括日期限制检索、文件格式限制检索、文献类型限制检索、文献语种限制检

索等。 “通过设置检索条件发现目标文献” 的过程, 也可以描述为 “目标文献被找到了” 。

一般来说,检索点越多,检索工具的性能就越好。

3.检索界面

传统的检索工具一般给出类号、类目名称和起始页码,供人们从分类途径检索文

献 ; 计算机检索工具根据用户的习惯不同,提供不同的检索界面,常见的有导航检索

界面、简单检索界面、高级检索界面、专家检索界面等。

导航检索界面对于一些主题明确但关键词不容易确定的信息检索问题非常有用。

由于分类体系具有很好的层次树结构,因此各检索工具都借助分类体系实现信息导航

功能。如维普中文科技期刊数据库中的分类检索、中国国家知识产权局专利数据库的

IPC 分类检索、宇飞标准文献服务系统的中国标准分类导航功能。此外,一些检索工具

还提供首字母或出版物名称的导航检索。简单检索界面,一般只有一个输入框,用户

无需选择检索字段。高级检索界面,一般有两个或两个以上的输入框,用户可以选择

检索字段。专家检索界面,一般只有一个输入框,由用户直接输入检索式。

4.检索式

检索式是指将各检索单元(其中最多的是表达主题内容的检索词)之间的逻辑关

系、位置关系等,用检索系统规定的各种组配符(也称算符)连接起来,成为计算机

可识别和可执行的命令形式。检索式是检索策略的具体体现,它控制着检索过程。检

索式是否合理关系到能否检索到最相关的信息。

传统检索工具的检索式往往是一些类号、代码等,计算机检索工具的检索式可以

是一个简单的词,也可以是几个检索条件通过逻辑关系组合成的式子。

针对不同的搜索引擎、数据库、信息需求,有不同的检索策略,其检索式的构造

也各有不同。设计合理的检索式成为控制和提高检索质量的关键。检索式的表达对一

个课题不是唯一的,而是有多种选择、组配、限定。当检索过于复杂,检索要求难以

用一个检索式来表达时,应该采用分步检索或二次检索以提高查准率

5.使用说明

检索工具的使用说明一般包括基本情况说明、编排结构、检索提示。基本情况包

括收录文献的类型、所涵盖的学科范围、收录文献的时间等。

(三)检索工具的类别

1.按信息加工的手段划分

(1)手工检索工具

手工检索(Manual Retrieval)是一种传统的检索方法,它是用人工方式——以手

工翻检的方式,利用工具书(包括图书、期刊、目录卡片等)来检索信息的一种检索

手段。检索的对象是书本型的检索工具, 检索过程是由人脑和手工操作相配合完成的,

匹配是人脑的思考、比较和选择。手工检索的方法比较简单、灵活,容易掌握。但是,

手工检索费时、费力,特别是进行专题检索和回溯性检索时,需要翻检大量的检索工

具反复查询,花费大量的人力和时间,而且很容易造成误检和漏检。

(2)机械检索工具

机械检索(Mechanical Retrieval)工具是手工检索工具向计算机检索系统过渡的中

间检索工具。它主要包括两种类型: 机电类检索工具(如利用打孔机做成的检索工具)

和光电类检索工具(如利用缩微机制成的检索工具) 。机械检索工具利用机械装置改进

信息资源的存储和检索方式, 但是只能对某一固定存储形式的信息资源进行特定检索,

过分依赖于设备,操作相对复杂,成本也较高,而且检索效率不理想,所以很快被计

算机检索工具所取代。

(3)计算机检索工具

计算机检索(Computer-based Retrieval)是指把信息及其检索标志转换成电子计算

机可以阅读的二进制编码,存储在磁性载体上,由计算机根据程序进行查找和输出。

计算机检索的对象是计算机检索系统,针对数据库进行,检索过程是在人与计算机的

协同作用下完成的,匹配是由机器完成的。这里检索的本质没有改变,变化的只是信

息的媒体形式、存储方式和匹配方法。

2.按收录的范围划分

(1)综合性检索工具

综合性检索工具指收录多学科、多语种、多载体文献的检索工具。其特点是涉及

范围广、历史悠久、具有权威性,同时可以提供多种查找途径,使用率高,数量多。

例如, 美国的《工程索引》 (The Engineering Index, 简称 EI) 、 英国的《科学文摘》 (SA)

以及中国的《全国报刊索引》等。

(2)专业性检索工具

专业性检索工具指收录某一特定专业范围内的各种文献线索或知识的检索工具。

特点是限定某个专业范围,仅供查找该专业文献时参考,在揭示文献的深度和广度上

常常比综合性的检索工具强,如《中国国防科技报告通报与索引》 《航空文摘》 《兵工

文摘》 《中国化工文摘》等。

(3)单一性检索工具

单一性检索工具指专门报道和揭示某一特定专题或特定类型文献的检索工具。这

种检索工具的特点往往不按文献的内容来收集资料,而是按特定的出版形式或其他形

式收录。如英国的《专利文摘》 、美国的《国际学位论文摘要》等。

3.按著录的格式划分

(1)目录型检索工具

目录型检索工具是记录具体出版单位、收藏单位及其他外部特征的工具。它以书

或刊物的外部特征为报道对象,对内容特征揭示少,著录项目包括书名、刊名、著者、

出版项(出版者、出版地、出版年、版次和页数、开本、定价)等项目,如馆藏目录、

联合目录、国家书目、出版社目录等。

(2)题录型检索工具

题录型检索工具是以单篇文献为基本著录单位按照一定的排检法编排,来描述文

献外部特征(如文献题名、著者姓名、刊名、年、卷、期、页码、语种、文献出处等) ,

内容摘要,快速报道文献信息的一类检索工具。信息报道快、全,出版迅速,是查

找最新文献检索的重要工具。它与目录的主要区别是著录的对象不同。目录著录的对

象是单位出版物,题录的著录对象是单篇文献。

(3)索引型检索工具

索引型检索工具是根据一定的需要,把特定范围内某些重要文献中的有关款目或

知识单元,如书名、刊名、人名、地名、语词等,按照一定的方法编排,并指明出处,

供用户查检的一种检索工具。索引揭示具有重要检索意义的内容特征标志或外部特征

标志,按照一定顺序排列,并注明文献条目线索的检索工具。

索引是对文献内容较深入的揭示,可以提高文献检索的深度和检索效率。索引的

类型是多种多样的,在检索工具中,常用的索引类型有分类索引、主题索引、关键词

索引、著者索引等。

(4)文摘型检索工具

文摘型检索工具是将大量分散的文献,选择重要的部分,以简练的形式做成摘要,

并按一定的方法组织排列起来的检索工具。按照文摘的编写人,可分为著者文摘和非

著者文摘。著者文摘是指原文著者编写的文摘,而非著者文摘是指由专门熟悉本专业

的文摘人员编写而成的。就其摘要的详简程度, 可分为指示性文摘和报道性文摘两种。

指示性文摘以最简短的语言写明文献题目、内容范围、研究目的和出处,实际上是题

目的补充说明,一般在 100 字左右 ; 报道性文摘以揭示原文论述的主题实质为宗旨,

基本上反映了原文内容,讨论范围和目的,采取的研究手段和方法,所得的结果或结

论,同时也包括有关数据、公式,一般在 500 字左右,重要文章可多达千字。 

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈