首页 理论教育 信息资源检索相关概念详解

信息资源检索相关概念详解

时间:2023-11-26 理论教育 版权反馈
【摘要】:主题词的合理选择与使用对检索结果的优劣直接相关。事实检索以事实为检索对象,从存储事实信息系统中查找出指定的事实,如检索某一时间、地点、过程、事物、概念等。评价检索效果的指标有收录范围、查全率、查准率、响应时间、用户负担、输出形式六项。查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。

信息资源检索相关概念详解

(一)信息资源检索方法

信息检索是先将信息按一定方式组织和储存起来,再针对信息用户的特定需求查找出所需信息内容的过程。信息检索的过程包括两大部分:信息标引和存储过程、信息的需求分析和检索过程。前者由信息系统的专家及有关机构完成,后者是用户借助一定检索工具自由完成。信息检索过程实际上可以看作用户信息需求与文献信息集合的比较、选择和匹配的过程。

信息的检索、利用和创造是一个循环和增值的过程。人们通过检索工具获得信息,经过处理筛选出需要的部分,在利用信息的过程中又创造出新的信息,这些信息经过核准又被标引、组织进检索工具(数据库),再提供给人们使用,信息在这个循环的处理过程中不断得到扩充。利用信息资源检索技术可以提高工作的成功率、缩短获取信息的时间,从而充分利用信息资源,避免重复劳动更新知识,实现终身学习

常见的信息检索方式有分类检索、主题检索、作者检索、名称检索、号码检索等。

1.分类检索

从文献内容所属的学科类别出发来检索文献,它依据的是一个可参照的分类体系。分类体系是按照文献内容特征的相互关系组织文献,并以一定的标记进行排序、检索。比较权威的分类体系有中国图书馆图书分类法(简称中图法)、美国 国会图书馆分类法、杜威十进分类法。

2.主题检索

主题检索是从反映文献内容的有关主题词出发来检索文献,类似字典、辞典检索。主题词(Subject)有多种类型,如规范词和自由词、单元词和多元词等。主题词的合理选择与使用对检索结果的优劣直接相关。

3.作者检索

作者检索是从文献的作者姓名出发来检索其文献。广义的作者还包括汇编者、编者、主办者、译者等。此外,还有代表机构、单位的团体作者、作者所在单位等。

4.名称检索

名称检索是从各种事物的名称出发来检索文献信息。这些名称既包括书名、刊名、资料名、出版物名、出版社名、会议名、物质名称等,也包括人名和机构名。

5.号码检索

号码包括文献的编号、代码等,它们是文献信息的一些特有的外部标识,号码检索以号码特征来检索文献信息。号码多种多样,通常用数字、字母或用它们结合的形式或以分段的方式来表示其各部分的含义。比如,科技报告有报告号、合同号、拨款号等;专利文献有专利号、入藏号、公司代码等;期刊有刊号、邮发代号等。

按检索方式的不同,信息检索的类型可以划分为手工检索、计算机检索。前者使用印刷型或书目型检索工具,由指定人员手工进行比较、选择、查找任务。通用的检索刊物可以定期地将最新收集到的信息、文献加以汇总、组织和报道,为手工检索用户提供服务。后者是在人与机器的合作、协同下完成的,以实时、交互的方式从计算机存储的大量数据中自动分拣出用户所需要的信息。其中,计算、比较、选择、匹配等任务由计算机系统执行,用户只需要提供检索的条件和要求。

按检索内容的不同,信息检索可以分为书目检索、全文检索、事实检索、数据检索。其中,书目检索是利用书目、文摘、索引等工具检索,检索的结果只提供相关信息线索,如书名、题名、篇名、作者等。全文检索是以查找到信息全文为目的。事实检索以事实为检索对象,从存储事实信息系统中查找出指定的事实,如检索某一时间、地点、过程、事物、概念等。数据检索是利用参考工具书、数据库等查找某一数据、参数、分子式、图表等,如长江的精确长度

(二)信息资源检索技术

1.布尔检索

布尔检索,是指利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种技术。常用的布尔运算有与(AND)、或(OR)、 非(NOT)三种,如检索“法律and河南”表示检索同时包含“法律”和“河南”两个关键词的信息。

2.截词检索

截词检索是把检索词截断,取其中的一部分片段,再加上截词符号一起构成检索式的方法。截词检索常用于检索词的单复数、词尾变化、拼写方法变异等。

3.位置检索

位置检索是利用记录中的自然语言进行检索,词与词之间的逻辑关系用位置算符组配,对检索词之间的相对位置进行限制。这是一种可以不依赖主题词而直接使用自由词进行检索的技术方法。

4.字段限定检索

字段限定检索,是指限定检索词在数据库记录中的一个或几个字段范围内查找的一种检索方法。常用的字段限定符号有“in”“=”等。(www.xing528.com)

5.加权检索

加权检索是某些检索系统中提供的一种定量检索技术,用于判定检索词或字符串在满足检索逻辑后对文献命中与否的影响程度。

一次完整的信息检索步骤应该包括检索目的确定、检索准备、检索系统选择、检索式编写、检索结果分析等。首先要根据课题要求分析检索的主题、范围等,确定后还要做一些检索准备工作,如查找课题相关学科的主题词、感兴趣的研究机构、专家学者信息等。

然后选择合适的检索工具,编写检索式进行检索,如果检索结果不理想还可以修改检索式、调整检索策略,或者选取其他检索工具重新检索。该过程可以重复进行,直到结果满意为止。

检索效果,是指检索系统检索的有效程度,它反映检索系统的能力,通常从技术和经济两个方面来分析。技术效果指系统的性能和服务质量,它是由检索系统实现其功能的能力所确定的;经济效果指检索系统服务所花费的成本和时间,它是由检索系统完成其检索服务的代价确定的。

评价检索效果的指标有收录范围、查全率查准率、响应时间、用户负担、输出形式六项。查全率(Recall Ratio,召回率)和查准率(Precision Ratio,准确率)是反映检索效果的重要指标。查全率是衡量某一检索系统从文献集合中检出相关文献成功度的一项指标,即检出的相关文献与全部相关文献的百分比。查准率则为检出的相关文献与检出的全部文献的百分比。

(三)国内外著名检索工具

1.国内著名检索工具

国内主要检索刊物包括《全国报刊索引》《中国科学引文索引》《中国社会科学引文索引》等。

(1)《全国报刊索引》

《全国报刊索引》是由上海图书馆编辑出版,是国内最早出版发行的综合性中文报刊文献检索工具。收录全国8000余种期刊,涉及所有哲学、社会科学、自然科学以及工程技术领域。内容包括我国与各省市自治区党政军、人大、政协等重大活动、领导讲话、法规法令、方针政策、社会热点问题、各行各业的工作研究、学术研究、文学创作、评论综述以及国际、国内的重大科研成果等。月报道量均在1.8万条以上,每年的报道量合计在44万条左右。

(2)《中国科学引文索引》

《中国科学引文索引》是由中国科学院文献情报中心编制,通过著者、机构名或主题词查找文献;通过引文索引了解某一课题研究过程,揭示文献间相互联系情况,利用引文著者检索该著者文章被引用情况、引用频率,为科管工作提供参考性的定量材料。还可为机构发文量、地区和国家发文量提供统计数据。

(3)《中国社会科学引文索引》

《中国社会科学引文索引》是由南京大学编制,是我国人文社会科学主要文献信息查询和评价的重要工具。

2.国外著名检索工具

国外检索工具主要有SCI、EI、ISTP,其因收录文献广泛、检索途径多、查找方便、创刊历史悠久而备受科研人员及科研管理部门的青睐。其收录文章的状况是评价科研机构和科研人员的成绩、水平以及进行奖励的重要依据之一。

(1)SCI

SCI(Science Citation Index,《科学引文索引》)是美国科学情报研究所出版的一个世界著名的期刊文献检索工具。它收录了全世界出版的数、理、化、农、林、医、生命科学天文地理、环境、材料、工程技术等自然科学各学科的核心期刊3700多种。其通过严格的选刊标准和评估程序来挑选刊源,使收录的文献能够全面覆盖全世界最重要和最有影响力的研究成果。为避免引起误会,不应该叫作“SCI期刊”,因为它是一个科学引文检索模式。

SCI运用科学的引文数据分析和同行评估相结合方法,综合评估期刊的科学和学术价值。SCI通过严格的选刊标准和评估程序挑选刊源,而且每年略有增减,所收录的文献能全面覆盖全世界最重要、最有影响力的研究成果。SCI索引对科技工查阅最新文献、跟踪国际学术前沿、科研立项以及在具体的课题研究时及时了解国际动态都有很大帮助。

(2)EI

EI(The Engineering Index Annual,《工程索引》)是美国工程信息公司出版的著名工程技术类综合性检索工具。《工程索引》报道美国工程学会图书馆收藏的工程技术文献,具体内容包括土木建筑,建材,材料性能与试验,工程地质采矿石油燃料技术,冶金机械核技术力学与真空技术,热与热力学航天工程,自动化,海洋工程铁路电工电子通信工程,计算机与数据处理控制工程光学技术,声学技术,化工农业工程与食品技术,工业技术领域以及各种工程活动,如研究、开发、试验、设计、建造与维修、生产、销售、咨询及教育等。其来源包括世界50个国家用15种文字出版的工程技术文献约3500种,其中,英文占50%,主要是美国的工程技术文献。年报道量约13万条。它具有综合性强、资料来源广、地理覆盖面广、报道量大、报道质量高、权威性强等特点,在全球的学术界、工程界、信息界中享有盛誉,是科技界共同认可的重要检索工具。

(3)ISTP

ISTP(Index to Scientific&Technical Proceedings,《科技会议录索引》)创刊于1978年,由美国科学情报研究所编辑出版。该索引收录生命科学、物理化学科学、农业、生物和环境科学、工程技术和应用科学等学科的会议文献,包括一般性会议、座谈会、研究会、讨论会、发表会等。其中,工程技术与应用科学类文献约占35%,其他涉及学科基本与SCI相同。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈