首页 理论教育 实用科技论文写作:文献检索技巧

实用科技论文写作:文献检索技巧

时间:2023-12-06 理论教育 版权反馈
【摘要】:1.8.1检索的要素1.8.1.1用户是实施信息检索的主体用户的信息需求是产生信息检索的必要条件,通过用户指定的检索策略和检索条件来达到检索的目的信息。

实用科技论文写作:文献检索技巧

1.8 文献检索

对本节的阐述,假定您已经具备了当今计算机网络操作与应用的基本知识。这里的文献检索,侧重于计算机检索,属于传统的手工检索方式的《新华字典》或邮政编码检索,现在也被计算机检索所替代了。

要通过互联网查找电子资料,“百度”和“谷歌”是我们耳熟能详经常使用的查找电子信息资源的强大搜索工具,此外还有搜狗雅虎搜狐等。联机计算机图书馆中心(Online Computer Library Center,OCLC)于2005年做的一项全球性的调查结果表明:通过选择索引擎查找信息的人占84%,选择在图书馆的首页上查找资料的只占1%,20%的大学生和13%的美国年轻人表示他们对在线图书馆非常熟悉,而非常熟悉或基本熟悉搜索引擎的大学生达98%,只有极少数的大学生从没有听说过搜索引擎。

此调查结果表明通过互联网的搜索引擎进行计算机检索信息的重要程度、便捷程度、高效程度、普及程度、熟悉程度是相当高的。因此,要想查找到你所需要的文献信息,通过互联网搜索检索信息的技能是你必须掌握的。

搜索信息所借助的工具称为信息检索工具,用户想查找满足特定条件的信息的需求称信息需求,满足用户设定条件的信息称为目标信息,目标信息满足的特定条件称检索条件。一次检索过程可以设定多个检索条件,不同的检索条件之间有逻辑或“or”、逻辑与“and”、逻辑非“not”3种关系。每一个检索条件由目标信息的某个特征项及该特征项内容所应包含的检索词两部分组成,描述检索条件的表达式称为检索式。

【小技巧】当采用“百度”或“谷歌”的简单检索功能时,可用空格将不同的检索词分隔开来形成“逻辑与”的功能。

用户为达成信息需求而设定的检索条件,选择合适的检索工具和适当的方式操作检索工具,识别检索工具给出的信息线索,及依据信息线索找到的信息是否满足信息需求的方法,保存或处理检索工具给出的满足信息需求的信息的方法等统称为检索策略,这些内容中只要一项不同就会形成不同的检索策略。

互动区

您利用互联网查找过信息吗?您知道在互联网上如何查找信息吗?在互联网上查找信息,您通常是怎么做的?

1.8.1 检索的要素

1.8.1.1 用户是实施信息检索的主体

用户的信息需求是产生信息检索的必要条件,通过用户指定的检索策略和检索条件来达到检索的目的信息。但用户对目标信息的认知程度将直接影响到其所选择的检索工具、制订的检索条件和使用的检索策略。就是相同的主题,不同的用户检索到目标信息的目标记录的相关度高低、命中记录的数量也不同。

1.8.1.2 信息资源与用户的信息需求是一种互为依相的关系

用户有检索信息的需求,才产生了信息资源库和检索工具,信息资源库和检索工具的产生,又方便了用户对信息的检索,用户利用这种资源,又可产生新的信息资源更新补充资源库。因此,它们之间是相互依赖和相互促进的。

1.8.1.3 检索策略帮助用户最终找到所有的目标信息

检索策略是否合理有效,取决于用户对信息需求和信息检索工具的理解和熟悉程度。比如,知晓有哪些信息资源库可用,有哪些检索工具可用,什么样的检索关键词最恰当相关等,这些将直接影响用户是否能检索到其所需要的信息,以及找到的信息的相关度和高效度。

1.8.1.4 检索效果是衡量检索是否成功的直接指标

检索效果的好坏与用户的信息需求有直接关系。如果用户希望找到所有符合条件的信息线索,那么当用户找到了所有符合条件的信息线索时,才表明其检索效果为100%。如果用户只希望找到所有符合条件的信息线索中的任意一条,那么当用户找到了一条符合条件的信息线索时,其检索效果也是100%。但在检索实践中,目前不可能存在穷尽世界上所有信息的检索工具,故而有时用户很难找到符合要求的信息,甚至连一条记录都找不到;由于用户个人制订的检索策略和检索条件不够科学正确,即使存在该目标信息的,也不一定能命中。

基于此,人们用“查全率”和“查准率”来衡量检索效果。其中:

img1

要注意:从理论上和实际上,有的目标信息的总记录数是无法预知的,因此,“查全率”就失去了意义。只有用户自己去判断其要查找的目标信息是否可以认为很全了。

对于已经找到的信息,如果该信息不符合用户的真正需要,这样的信息就是常说的“垃圾信息”。垃圾信息的产生,一方面是用户自己制订检索表达式不够科学准确造成的,一方面可能是计算机无法智能辨识目标信息造成的,还有一种可能是搜索引擎工具人为干预造成的。

对于查全率,理论上是尽量做到100%时最好,但要达到100%查全是有难度的。一方面有的信息无法获得或者预知其具体的总量,一方面要查全可能需要耗费巨大的人力、物力、财力以及时间,有时并非有查全的必要。需要注意的是:如果查全率不是特别高,有可能造成漏检,而漏检的信息,可能对用户的决策具有重要的影响。因此,在条件允许的可能下,要尽量做到100%的查全率。

对于查准率,这是体现用户制订检索条件,以及检索工具智能程度高低的唯一指标。用户制订的检索条件越科学准确,检索工具的检索辨识能力越高,则查准率就越高。

1.8.1.5 信息检索工具是信息检索过程顺利实施的重要保证

检索工具的智能强大程度,直接关系到检索任务的完成质量,包括用户能否在较短的时间内,以较少的成本,找到足够多的目标信息的线索及原始信息。不同的用户要求目标信息满足的条件不同,所使用的信息检索工具也不一定相同。如查找汉字读音或意思用《新华字典》,查找邮政编码用黄页,查找中文期刊论文用“中国知网”、“维普中文科技期刊数据库”、“万方资源系统”,查找英文医学论文用PubMed数据库,查找一般的大多数信息,用“百度”、“谷歌”、“搜狗”搜索引擎,等等。

1.8.2 文献检索工具类型及其要素

1.8.2.1 各式各样的文献检索工具

常见的文献检索工具诸如专业检索工具、搜索引擎、门户网站等。

门户网站是指一个机构或组织所建立的网上导航系统。通过该导航系统的框架或者检索入口,可以进入或者查找到该站内的信息资源,这即网民所熟知的“站内导航或搜索”。

专业检索工具特指收录特定类型文献的检索工具,比如专业检索纸质版的化学文摘及其索引的CA工具,检索专利的国家专利数据库,检索大多数文献资源的清华同方数据库即中国知网、维普中文科技期刊数据库、万方资源系统、标准文献数据库、SCI/Ei数据库等。

不同的检索工具,其检索结果所提供的信息格式各有特色,目前主要有目录型、文摘型、全文型检索工具。

(1)目录型 该类型的检索工具仅仅提供文献的名称和来源。比如现代化图书馆向用户提供展示图书馆藏文献情况的信息。

(2)文摘型 除了提供文献的名称、来源等信息外,还提供文献的摘要。用户通过摘要可以更多地了解原始文献的主要内容。比如美国的化学文摘CA,美国工程索引Ei,科学引文索引SCI,临床医疗医药卫生文献索引MEDLINE,ISI会议文献索引(ISI Proceedings,ISIP),医学公共数据库PubMed等。注意:由于检索工具功能更新,一些文摘型也提供全文。

(3)全文型 除了包含前面两种类型的所有信息外,还提供了原始文献的全文信息。比如中文的超星数字图书馆、中国知网、维普中文科技期刊数据库、万方资源系统等,英文的如Science Direct、Springer、Blackwell-Wiley数据库等。

1.8.2.2 文献检索工具的要素

文献检索工具的要素包括其所能检索的各种文献资源、著录、检索点、检索界面和使用说明。对计算机检索工具,还得有检索界面、检索式、检索词及其匹配方式、检索结果记录排序方式、检索结果的记录分析统计下载保存等。

(1)文献资源 文献资源是文献检索工具存在的物质基础,可有一种或多种类型的文献线索信息或全文,比如新闻报纸、期刊、专利、学位论文、会议论文、产品信息、标准信息、政策法规、企业信息、图片信息等,其表现的载体也多种多样,如纸质出版物、PDF文档、图片、视频等。不同的检索工具,其所收录的文献资源的标准也不尽相同,不同类型的文献信息具有不同的特征项,有的是共同的,如文献名称、作者、出版日期、来源、语种、作者单位、国家、作者通信地址、联系方式、载体类型、保存格式等;有的是特定的,如图书的有国际标准书号(Internationa Standard Book Numbe,ISBN),期刊的有期刊号(International Standard Serial Number,ISSN)。

(2)检索点及相关术语 检索点大体可分为两类:内容特征和辅助特征。内容特征主要指能够表明文献基本内容的特征,如文献名称、关键词、主题词、摘要、分类号等;辅助特征主要指内容特征以外的文献特征,如作者、出版者、出版物名称、出版日期、单位、标志号、文献类型等。

这些特征都可以作为用户检索目标文献的检索点或检索条件,这些特征指定得越准确,所检索得到的文献可能也就越符合用户的需要;这些特征指定组合起来一起使用进行检索,则组合的特征数越多,所得的文献资料的相关度可能就越高,但检索得到的文献记录数可能就越少,甚至有的无命中。

(3)检索界面 不同的检索工具,各有各的检索界面,用户只需根据其所提供的检索界面,按要求和提示进行操作即可。

(4)检索式 是用户想得到什么样的文献信息之前,必须告诉检索工具如何去查找到可能属于目标信息的文献,必须制定好的一个规则。这些规则可以是一个,也可以是多个组合起来,它们的逻辑关系可以是等于、包含、排除、相与等关系。这些规则的数量与逻辑组合关系,与最终的检索结果的相关度和命中记录数息息相关。

(5)检索式的匹配方式 常见的匹配方式有语义匹配方式和形式匹配方式两种,如图1-1所示。

img2

图1-1 检索式的匹配方式

语义匹配要求目标文献满足“被检索字段含有与检索词相同语义的内容”。当检索词为名词、动词、形容词或词组时,语义匹配称为概念匹配,又称同义词或近义词匹配;当检索词为语句或短语时,语义匹配称为自然语言匹配。比如检索“维生素E”的文献,而“生育酚”的文献也被命中,这属于语义匹配。因为“生育酚”跟“维生素E”是同义的。

形式匹配一般不考虑检索词的语义,只要求目标文献的被检索字段与检索词进行形式上的匹配。因此,上述的检索“维生素E”的文献,则“生育酚”的文献就不会被命中。

因此,匹配形式不同,相同的检索条件所得的检索结果也不尽相同。但从计算机实现技术上来说,形式匹配的实现相对要容易些,也是大多数检索功能所采用的匹配方式。

(6)检索结果输出方式 一般包括排序方式和文献著录项显示格式,根据检索工具提供的功能和选择项进行指定符合用户自己需求的输出方式即可。比如按相关度排序,按时间递增或递减排序等。

(7)检索结果记录分析统计 对检索结果进行分析统计可以发现隐含在相关文献中的一些趋势或规律,比如发现课题的研究进度、课题的研究热度、个人或者单位的研究影响力等。这些统计分析,有的需要用户自己去做,有的检索工具则提供参考性的统计分析功能。

(8)检索结果的下载保存方式 根据检索工具所提供的下载保存方式进行操作即可。

【提醒】若短时间内大量地下载保存,有可能被检索工具提供者认定为非法操作,进而被禁止和限制,甚或被认为是侵权而被告。

(9)个性化功能 为方便用户的检索需要,检索工具提供给用户的一些个性化功能,比如保存检索式、采用何种语种等。

(10)检索说明/使用帮助 对于初次或者不熟悉的用户,需要提供检索使用帮助,以有利于用户的检索效率和检索质量。

1.8.2.3 计算机文献检索工具的评价

使用过计算机检索工具的用户,都会发现,不同的检索工具,对相同的检索需求,其检索效果、检索效率、检索体验、检索成本等都不尽相同,甚至大相径庭。比如用谷歌检索某信息,第一屏的检索结果相关度就相当高,而百度的总信息记录数比其多。

需要注意的是,不同的评价主体的评价目的不完全相同,因此,在评价检索工具时,还需要再结合实际情况、用户的需求和评价目的。比如图书情报机构的文献采集人员,主要从全体用户的信息需求的角度来评价检索工具的文献资源范围和质量,而用户则主要考虑自身的信息需求和易用度。

1.8.2.4 专家检索

搜索引擎为了迎合大众用户简单方便检索信息的需要而推出的高级功能,比如只搜索限定的文件类型如doc、pdf、mp3等,或只搜索限定的范围如网页的标题、网址、站点等。如表1-1中所示的有关专家检索示例。

表1-1 常用搜索引擎专家检索表达式

img3

续表

img4

注:有的表达式适用于“百度”,有的适用于“谷歌”,有的二者都适用。

互动区

请根据表1-1中的语法,用谷歌、百度或其他搜索引擎尝试验证上述检索表达式,并将您的检索结果以及体验与大家分享。

1.8.3 学术搜索引擎

主要针对科学研究领域的专业学术搜索,比如非学术专业搜索在搜索“Dolly”时,结果可能是一个人名或者其他信息,而专业学术搜索时的结果则是“克隆羊”。

著名的学术搜索引擎主要有Google Scholar,SCIRUS,Scientific Web Plus,Highly Cite.com,Science Watch,Biology Browse,Index to Organism Names,in-cites等。具体的使用操作方法和步骤,须参阅各自引擎的功能设计和说明。

(1)谷歌学术搜索(http://scholar.google.com.hk) 提供最广泛便捷的学术搜索,可搜索图书、文章、论文、摘要等,以及学术文献被引用次数和相关文献及版本信息等(图1-2)。

img5

图1-2 谷歌学术搜索(高级检索)

(2)SCIRUS(http://www.scirus.com) 由美国Elsevier公司开发的一款专为科学家、科研人员和学生提供免费网络文献及科研信息检索的工具(图1-3)。

(3)Scientific WbPlus(http://scientific.thomsonwebplus.com) 由美国汤姆森路透(Thomson Reuters)集团公司创建的一款有偿搜索工具,为专业研究人员提供最密切的相关Web资源,对于了解科研界的最新信息、资源和动态资讯极为有用。该引擎只对会员开放。

(4)Highly Cited.com(http://highlycited.com) 汤姆森路透旗下的一款提供了20多个领域内的有影响力的科学家和学者的全面信息的免费专家数据库。

img6

图1-3 SCIRUS学术搜索

(5)Science Watch(http://sciencewatch.com) 汤姆森路透旗下的一款主要跟踪研究热点或新兴的学科领域,以及基础研究领域的全国性或全球性发展趋势的工具。

(6)Biology Browser(http://www.biologybrowser.org) 一款提供对生命科学信息社区具有帮助作用的信息和书目信息的链接的工具。

(7) Index to Organism Names(http://www.organismnames.com)

一款可以查找到所有动物植物和病毒名称的数据库工具。

(8)in-cites(http://www.in-cites.com) 一款免费提供有关收录的科学家、期刊、机构、国家地区以及论文的背后故事的工具,对于撰写访谈、特写故事、原创评论等具有帮助作用。

互动区

请亲自尝试上述8种学术搜索引擎的功能,了解其检索界面、检索操作、检索功能、检索效果、检索体验、适用范围等,并与大家分享您的体验。

1.8.4 检索策略与技巧

当需要针对某信息需求查找相关文献信息资讯时,如何才能准确、有效、便捷地获得目标文献信息资讯,对于新手来说,需要掌握一些检索策略和技巧。

1.8.4.1 制订检索策略的基本步骤

(1)问题定位 用户要明确自身的信息需求,认真分析所面临的信息问题,确认完成这项任务所需的信息。这是前提,问题定位错误或不确切,直接影响后续工作。

(2)订策略 要求用户研究可能存在的所需信息的信息资源,并确定这些信息资源的优先顺序、适用范围、真实性和高质量性,毕竟如今的信息量大,信息来源渠道也多,正规渠道和非正规渠道的都有。一般应针对不同的检索目的以及信息问题涉及的学科领域来选择检索工具,比如检索中文学术论文的,可选择“中国知网”、“维普中文科技期刊数据库”、“万方资源系统”等;检索中国专利的可选择中国国家专利网;查找某著名机构或者学者的相关信息,可查找该机构的网站或者学者的个人网站等。

确定信息源之后,即可利用相应的检索工具,根据该检索工具提供的检索功能进行相应的检索操作,才能获得您可能需要的信息。

(3)获取信息资料 通过检索工具提供的资料获取功能获取所需要的信息。

(4)阅读整理获取的信息 通过检索工具检索获得可能所需的信息之后,要求用户快速阅读所得的信息,并根据信息进行摘录或保存信息。一般情况下,有时检索获得的信息众多,为了快速筛选相关度高的信息,可先阅读摘要,必要时再阅读全文。对于信息的保存,方法众多,比如保存为单个文件,也可以摘录保存到Word或Excel文档中,也可以用更好的工具End Note来管理。

(5)综合分析评价所得的信息 将检索得到整理后的信息进行综合分析评价,评价这些信息是否满足目的,如果不满足,则需要重新调整检索策略,比如调整检索工具、信息源、检索表达式等。

1.8.4.2 检索语言对检索策略的影响

现今存在多种检索工具,各检索工具所采用的检索语言不同,会影响检索策略。比如查找个人发表的中文论文的被引用情况,用中国知网就比用维普好;查找个人发表的外文文献的被收录情况,用SCOPUS就比用SCI好;通过某期刊ISSN号检索该刊最新论文的摘要情况,用JCR就比用SCI好;查找某化学反应或者药物合成的路线,用Reaxy数据库就比用Sci Finder Scholar好等。

1.8.4.3 注重检索技巧的灵活运用

对某问题的信息检索的效果评价,主要体现在“查全率”和“查准率”的高低,根据目的不同,对这两个指标的要求也不尽相同。因此,需要运用相关检索技巧,方能有效实现查全率和(或)查准率。以下几种技巧可供参考。

(1)单项检索 以一个检索词进行的检索称为单项检索(图1-4)。这种方式有时会导致查准率太低,有时会导致查全率太低,特别是信息量大但相关度低的不足即“垃圾信息”冗余的现象。为了排除这些多余的冗余信息,有的检索工具提供了“在结果中再次检索”的二次检索功能,否则,只能采用下面的组合检索。虽然二次检索功能可以免去用户因不熟悉或者不知道如何书写检索组合逻辑表达式带来的不便利性,但存在不同的检索字段组合时,二次检索功能却不是最理想的,此时须使用组合检索。

img7

图1-4 单项检索及其效果示例

(2)组合检索 不同的多个检索角度或同一个检索角度多个检索关键词同时进行检索称为组合检索(图1-5)。组合检索的实施,必须依赖于检索工具具有组合检索的功能,具体的组合检索功能,须参见相应检索工具的功能说明。这里的组合检索模式中,根据需要可以采用同时满足各个单项检索的条件,即逻辑与“and”组合模式,也可以只需满足其中一个检索条件,即逻辑或“or”组合模式。另外,在同一组合检索表达式中,逻辑与、逻辑或还可以嵌套使用。比如下面的一些组合检索表达式:A and B and C,A or B or C,A and(B or C)。还有一种逻辑非表达式,即排除“not”,比如:A and(B or not C)。

img8

图1-5 组合检索及其效果示例

其中,“and”可以提高检索的准确率,“or”可以提高检索的查全率,“not”可排除干扰垃圾信息。另外,还可以使用邻近运算符(nW),表示字符串A与B之间相隔nW个字(单词);(nW)邻近运算符,表示字符串A与B之间相隔n个字(单词),但A、B的前后顺序可颠倒;或使用通配符*、?、#、$、%检索(即模糊查找),可以提高查全率,但所得的信息量会大幅度增大,因此反而有降低查准率的可能。

如下是一些组合检索的示例。

【例1】关键词/Keyword=[磁流体and(密封or泄漏)]and not机构=(河南科技大学or洛阳工学院)。此检索表达式表示用户希望检索关键词为“磁流体密封”,文献发表单位不是“河南科技大学”的作者所发表的文献。其中:“磁流体泄漏”为“磁流体密封”的同义词或近义词,二者进行or运算,可以提高查全率;not运算符表示排除;“洛阳工学院”是“河南科技大学”的前身,二者进行or运算可以提高查准率。一个组合型检索表达式中,可以包含一个或者多个or、and、not逻辑运算符,运算优先级为not>and>or,要改变默认的优先级,可以用小括号来界定。

【例2】cotton(5W)production。表示检索目标信息源中同时含有cotton和production这两个单词,且这两个单词前后顺序不能调换,二者之间相隔5个单词。这种方式称为邻近运算检索,可以不用增加检索关键词却能提高查准率,减少冗余信息。

【例3】cotton(5N) production。功能同例2,区别在于cotton跟production的位置可以调换。

【例4】nation*。表示通配符检索或模糊检索,*通配符代表0个或者多个字符或汉字,则可检索出包含nation,national,nationality等关键词的文献。

【例5】Chin* wom? n。表示通配符检索,?通配符代表任一个字符或汉字,则可以检索出China woman,China women,Chinese women,Chinese woman等关键词。

【例6】%药。表示该关键词的最后一个词是“药”字,可以查找出中药、西药、中草药、苗药、藏药等。同理,“计算%”,则表示该关键词以“计算”开头,可以查出计算机、计算器、计算化学等关键词。

【例7】题名/关键词/摘要=克隆羊。表示检索点控制检索,其中“题名/关键词/摘要”代表检索点即范围,此外还有“全文”、“所有字段”、“任意”、“作者”、“日期”、“来源”等限定范围。此是表示在“题名/关键词/摘要”等字段范围中检索包含“克隆羊”的文献。如果改变检索字段范围,则所得到的检索结果一般会发生变化,比如将检索字段范围改成“任意”或“全文”,则检索得到的文献数量应是最多的,这时查全率是提高了,但查准率下降了。这里需要提醒的是:如果检索范围指定为题名,当将题名全部输入后进行检索时,可能无结果,这种现象的发生大多数是题名的全称中包含了非法的或者不可识别的字符,这时就可尝试只截取题名全称中的一部分再重试即可。比如含有化学符号的题名全称就常出现这种现象。

【例8】题名=克隆,文献类型=综述。本表达式表示检索文献题名中含“克隆”关键词,文献类型属于综述型的文献,这样就可以减少检索出来的冗余信息。此外,文献类型还有评论、通讯、简报、研究论文等。如果再配合学科领域,则更多的冗余信息就被排除掉,比如将学科领域限定在“生命科学”,那么有关报纸通讯上刊载的与“克隆”关键词相关的文献就被排除掉了。

互动区

请用中国知网、谷歌、百度、搜狗,或其他检索工具,验证上述组合检索表达式,也可自拟检索表达式,然后体验检索结果和效果。

(3)准确的检索关键词和检索表达式是提高检索效果的关键同一检索目标,同一信息源和检索工具,如果检索关键词及检索表达式不同,所得的检索结果有时可谓天壤之别,因而也就大大影响查全率和查准率。若注意以下方面,则可有效提高检索效率。

1)多用语义不能再分割的单元词作关键词,可提高查全率,但查准率会下降;如果用多元词作关键词,查全率就会下降,但查准率会提高。比如“就业”从语义上不能再细分,为单元词,以其为检索关键词,则查全率高,但查准率低,冗余垃圾信息增多;而“大学生就业现状”从语义上可细分为“大学生”、“就业”、“现状”,则为多元词,则查准率提高。

2)同一对象的近义词和同义词都应检索,可提高查全率。比如查找英文“支架”时,就应将其同义词、近义词(tube? or scaffold? or conduit?)都作为检索关键词进行查询。

3)有效利用叙词表,可提高查全率或查准率。比如要查找食用油的产销现状,如果直接以“食用油”为关键词查找,可能漏检率高或者得不到所需要的信息,则可增加“食用油”的叙词表的近义词,比如“花生油”、“大豆油”等近义词一道检索,则查全率就更高。

4)避免含义宽泛模糊或偏窄的关键词。比如“研究”、“现状”、“进展”、“制备”等词过于宽泛,则往往查准率太低,冗余信息太多。

5)注意兼顾俗名、学名、商品名、全称、简称等,可提高查全率。比如土豆马铃薯,其实都是同一对象,如果只检索学名“马铃薯”,则会漏掉俗名“土豆”中的相关文献。

6)要遵循和利用相关数据库的人工标引,可提高查全率。

7)优先使用常用的专业术语。比如检索“氯化氢”就不如检索专业术语“盐酸”好。

8)先试检索,根据检索结果再行修正检索词或者表达式。

9)检索中文对应的英文单词时,可借助Google翻译、中国知网的工具书检索,可以获得某中文对应的词频较高的英文单词,优先以此词作为检索词。比如中文“做”,对应的英文单词或者词组有几十个,当用Google翻译进行帮助时,其中的“do,make,be”等单词的词频出现得较高的,则以词频较高的优先作为检索词。不过这不是绝对的标准,其实在科技文献中,“做”对应的词频较低的单词如“prepare,manufacture,compose”等反而经常出现。

互动区

自拟检索词,然后判断其是单元词还是多元词?其存在近义词、同义词吗?是否存在或属于专业术语?是否存在俗名?判断其语义上是宽泛或狭窄。最后在检索工具如谷歌或中国知网或其他检索工具上体验检索效果。

1.8.4.4 掌握特殊检索技术

为满足某一特定需要而开发的检索技术,比如相关性检索、加权检索、引文检索、语义概念检索、跨库检索、跨语言检索等。这些特殊的检索技术可使检索结果更加精确,检索操作更加方便。

(1)加权检索 即根据用户的需求给每个检索词赋予一定的重要性权重,有按词加权技术和按词频加权技术两种技术,可提高查准率,但对使用人员和开发人员都具有难度,比如Emerald数据库提供了加权检索功能,但大多数数据库多使用“相关性检索技术”。

(2)相关性检索 也即检索词在目标文献中出现的频次越高,则该文献属于目标文献的相关度也理应越高。因此,当检索结果出来后,将默认的按出版时间排序更改为按相关度进行排序,则排在最前面的记录,往往多是用户所期望的目标文献,则排在后面的文献可以不用关注或不用先关注。

(3)引文检索 通过文献的引证关系显示文献之间的内在联系的一种检索模式,比如科学引文索引数据库、中国引文数据等都提供此功能。引文检索途径主要分为被引用文献的作者、被引用文献的作者单位、被引用文献的来源。对引文检索结果进行统计分析,可以发现一些趋势和现状,或者统计规律,比如评判某学者或某论文的影响力。

(4)跨库检索 由于每一种数据库所收录的文献种类各有侧重点,如果只局限于某文献数据库中查找目标文献,可能无命中。另外,有时还有相互重叠的文献,为方便用户,有的检索工具提供了跨库检索功能,可以在一种检索工具内同时检索到其他检索工具中的文献,增强了使用上的便利性。比如在中国知网期刊全文数据库中进行检索时,勾选跨库检索,将其他数据库比如学位论文数据库、专利技术数据库包含进来一起检索,则所得的结果就会发生变化。

(5)跨语言检索 比如通过中文文献数据库,也能查找英文文献数据库中的文献,即跨语言检索。其检索的效果一般取决于将一种语言的检索关键词翻译成另外一种语言时的准确度的高低。

(6)文献漫游 即检索 到一篇文献时,与该篇文献的主题相关的文献和所引用的参考文献也被罗列出来,这样可浏览这些相关文献或参考文献,还可通过这些文献的链接便捷地了解其文献更多的信息。通过文献漫游功能,可节省大量的检索时间,用户通过分析文献漫游中提供的信息,可以发现一些统计规律。

互动区

自拟关键词,然后进行检索,对检索结果采用相关性排序,然后阅读排在最前面的几篇文献,评判它们是否跟您的预期高度相关。

自拟关键词,然后进行单库检索和跨库检索,查看检索结果有何差异。然后思考一下什么情况下需要跨库检索,哪些库需要包含进来,您取舍的依据是什么?

自拟关键词,然后进行检索,体验文献漫游给您带来什么样的便利和帮助。

1.8.5 文献全文的获取

通过检索工具检索得到的信息,基本上属于文摘类信息,其所承载的信息量有限,若这有限的信息不能满足您的需要,就需要获取文献的全文方能知晓。比如研究结果图表、详细的研究技术方案和实验步骤等,需要在文献全文中方能阅读到。在获得文献全文之前,首先要判断文献的类型和来源。

1.8.5.1 文献的类型

知晓文献的类型,可让您知晓如何获得文献全文,以及获得文献全文的难易程度,及其获取花费的高低。通常通过文献的著录信息基本上可确定文献的类型。

(1)图书类 其时效性差,适用于入门者对某一对象领域的背景知识和常识的了解。通过ISBN书号、document type= books、Press、出版社这些特殊的信息项基本可判断为图书类(图1-6)。获取图书类原文时,有时花费高。

img9

图1-6 图书类文献类型的特征信息项示例

(2)期刊类 内容具有详细性、针对性,时效性较好,能及时快速地反映某一研究领域的最新动态,是科研人士重要的参考文献类型。通常通过ISSN号、Journal/J、期/卷、杂志、学报等特征信息项来判断(图1-7)。

img10

图1-7 期刊类文献类型的特征信息项示例

(3)报纸类学术类报纸同时具有新闻性和学术性,比如《中国社会科学报》。由于出版周期很短,能更快地反映研究动向和新思潮,对人文社科领域的参考价值高。目前大多数报纸可直接通过互联网搜索引擎搜索得到。报纸类文献的特征一般是出版的时间为×年×月×日。

(4)学术会议类 文献由召开学术会议而形成的文献,大多数是反映有关研究领域最新发展和研究前沿动态的信息,有的资讯还是未公开发表的。学术会议的类型一般有国际会议、全国性会议、地区性会议等。但要注意有些质量不高的学术会议中所形成的会议文献,其参考价值要加以甄别。会议文献类的特征项一般在非题名部分含有会议,大会,conference,Conf.,meeting,proceedings,Proc.,地点和时间等特征信息。

(5)专利类 文献一般在国家代码后面紧跟特征号(几乎为数字)的多为专利类文献,比如CN 200610095.9为中国授权颁发的某专利号,同理DE 1324013D为德国授权颁发的某专利号,US 5831349为美国的某专利号,JP 2028687A为日本某专利号,WO 2008/135643为世界专利组织的某专利号等。

(6)学位论文类 基本上是高等院校和科研院所的研究生为申请相应的学位而撰写的论文。学位论文对科学研究以及科技论文的撰写都具有非常重要的参考价值,很多数据库都收录有学位论文,比如中国知网就收录有优秀硕士博士学位论文库。如文献信息项中含有××大学、××研究院/所、D、thesis、Dissertation等字样,则多为学位论文类文献(图1-8)。

img11

图1-8 学位论文类文献示例

(7)研究报告类 是研究人员围绕某一专题从事研究取得成果以后撰写的正式报告,或者是在研究过程中的每个阶段进展情况的实际记录,具有内容详尽专深的特点。研究报告一般署有篇名、机构名以及“report”或“报告”字样,有时还有报告号。研究报告以美国政府研究报告的居多,比如美国政府出版社PB、美国武装部队技术情报局AD、美国航空航天局NASA、美国能源局DOE等。

(8)技术标准类 是一种可靠的、合理的,且具有一定法律效力的文献。一般可分国际标准ISO、区域性标准如SABS、国家标准如中国标准GB/美国标准US/日本工业标准JIS等、行业标准如YY(中国医药行业标准)、企业标准QB。其特征信息一般是字母代号跟标准号以及年份号,如GB/T 8170—2008,ANSI/ISO/IEC 9636—3—2007。由于技术标准一般每隔几年或者一段时间就会修订改版,故应参考最新版本的标准。

互动区

自拟关键词,查找与该关键词最相关的一篇文献,然后判断该篇文献属于什么类型的文献。(www.xing528.com)

1.8.5.2 信息来源记录

信息来源是查找文献全文的最重要线索,目前,任何文献的信息项中都包含了信息来源一项,如图1-8所示的信息来源于“湖南农业大学”。对信息来源的著录,有完全信息和缩写信息两类。完全信息类为用户顺利找到文献全文带来便利,但缩写信息类就会给用户顺利找到文献全文带来一些不便。比如文献来源于Anal.Chem.,不熟悉的新手就不能清晰地得知该文献来源于哪里,只有经历过的才知晓该文献来自期刊Analytical Chemistry。这时,可以通过查找期刊的全称跟缩写对照表,比如通过http://www.lailook.net/kjrs/05/2009-11-14/359.html来查找该缩写对应的全称;或者通过ISSN刊号来唯一查证(图1-9),如通过http://journalseek.net/来查找期刊的全称。

img12

图1-9 利用ISSN刊号查找期刊的全称

互动区

查找与您的研究领域相关的以缩写表示的期刊的全称。

1.8.5.3 获取文献全文的途径

如今,虽获取文献的全文是很便捷的,但如是有偿获取,或只对会员开放,您不付费或不是会员,即使很便捷也不易获得全文。

(1)利用全文数据库获取 这是最方便最直接的途径,但正规的全文数据库几乎都是有偿的,不是会员或者未付费是无法获取的。但也有一些是免费的,比如中国国家知识产权局的专利数据库、美国专利数据库、欧洲专利数据库等。中文全文数据库比如有清华同方数据库(中国知网,图1-10)、维普数据库、万方数据库等。另外还有其他的一些文库,比如百度文库、道客巴巴文库、豆丁文库、360文库、新浪文档共享等。

img13

图1-10 全文获取示例——中国知网全文数据库的【下载】全文功能

需要注意的是,这些全文数据库提供的电子档的全文,一般都有专用的文件格式,需要专用的阅读工具软件方能阅读。比如中国知网的需要CajViewer阅读器,超星图书需要超星数字图书馆阅读器Ssreader,其他多需要用Acrobat Reader即pdf阅读器,或者Flash播放器或者IE浏览器等。

要快速获取全文,最便捷的方式就是利用全文检索工具直接采用该文献的全名直接检索即可,但有时该文献的全名中可能含有非法字符而不能被检索工具识别,会导致无命中,这时则需要截取文献全名中的部分再重试即可,或者将文献全名中可能的特殊非法禁用字符用通配符*或者?来代替也行。比如在维普中文科技期刊数据库中用文献全名“免疫磁分离-荧光PCR应用在肉类单增李斯特氏菌的监测”,就会无命中,原因是全名中含有禁用非法字符“-”,这时,如果截取全名中的部分或者将该禁用字符用通配符*或?来代替后,目标文献就被查出来了。

(2)利用“期刊联合查询”获取全文 不同的文献类型被不同的数据库所收录,如果用户都逐一查找每个数据库,则既不简便又会增大工作量降低效率,可以利用相应的数字图书馆或文献馆藏机构提供的“期刊联合查询”功能。

(3)利用搜索引擎搜索获取全文 如图1-7所示,通过搜索引擎查找到该文献来源于万方数据库,如果该来源属于免费资源,则直接可以获取全文;如果是有偿资源,且您的IP属于许可范围,也可直接获取原文。否则,您只能付费获取,或者通过其他方式获取了。

(4)馆际互借 各个图书馆、文献收藏机构之间为实现资源共享而衍生的一项服务业务称为馆际互借(Inter Library Loan)。这种互借业务有的是无偿的,有的是有偿的,有的提供纸质档,有的提供电子档,但都需要用户提出馆际互借申请,具体的情况需要咨询开展此业务的相关单位和部门。比如国家图书馆文献传递服务,北大/人大复印资料等即为馆际互借业务,一般复印1页文献在几元至二三十元之间不等。

互动区

自拟关键词,检索到目标文献时,您是如何获得该文献的全文的,该文献的全文能从哪些数据库中获取?您常用哪种全文获取方式?了解、咨询和体验一下馆际互借业务。

1.8.6 文献数据库类型

1.8.6.1 文摘型数据库

该类数据库著录了原始文献的题名、作者、来源、时间、内容摘要等信息项,读者可通过其大体了解文献的主要内容和基本信息。由于其记载所收录的文献信息量少,所以占用存储空间小,具备收录文献资料齐全、检索功能强大、下载方便快捷等优点。以下是一些常见的文摘型数据库。

(1) Science Citation Index Expanded(SCI,科学引文索引) 它是世界上著名的文献和引文检索综合性工具,与EI、ISIP、ISR一起同称世界四大著名检索刊物,其收录世界上自然科学、工程技术、临床医学等多领域约7 300多种最具影响力的学术刊物的期刊论文的基本信息,如书目记录、作者及地址、论文摘要及其参考文献和被引用次数等,并且每年还在不断地新增。此外,还收录会议论文、科技报告、专著和少量书评等。

(2) ISIProceeddings(科学技术会议索引) 类似SCI,主要收录国际学术会议上发表的科技论文,是查找会议文献的权威性检索工具,现已与SCI并库检索。

(3)Chemical Abstracts(CA,美国化学文摘) 主要收录以化学化工为主,涉及生物、医学、轻工、冶金、物理等领域的科技成果,它是化学、化工相关科研人员检索化学化工类文献的主要工具。

(4) Engineering Index(EI,美国工程索引) 主要收录有关工程技术方面(包括研究、开发、设计、生产、维修、销售、管理、咨询、教育等全部工程活动,不包括纯理论基础研究的科学文献和专利)的文摘型、综合性检索工具,也是鉴定、评价科研工程技术人员学术成果的权威性工具。

(5) Information Service in Physics,Electro-Technology,Comptuer and Control(INSPEC,科学文摘数据库) 主要收录物理学、电子工程学、电子学、计算机科学及信息技术方面的权威性文摘索引。目前已可以通过Engineering Village和ISIWeb of Knowledge跨库联合检索了。

(6) Cambrigdge Scientific Abstracs(CSA,剑桥科学文摘) 主要收录有关生命科学、计算机科学、航空航天科学、农业科学、环境科学、水科学、海洋科学、艺术与人文科学、社会科学等方面。

(7)Index to Scientific Reviews(ISR,科学评论索引) 主要收录全世界科技期刊及专著丛刊中有价值的评述性论文,通过这些高质量的评论,可以获得本学科或某个研究领域的研究发展概况、热点、方向和趋势等重要的、极为珍贵的参考信息。

(8)National Technical Information Service(NTIS,美国政府报告数据库) 主要收录美国政府立项研究开发的项目报告,以及少量收录西欧、日本及其他国家或地区的科学研究报告。参考价值大的主要集中在“四大报告”,即:美国商务部出版局报告PB,美国陆海空三军科研机构报告AD,美国国家航空和宇航局报告NASA,美国能源部报告DOE四大报告。

(9)Scopus数据库 收录了从1966年以来的文献的文摘和索引,覆盖面极其广泛。

(10)BIOSIS Previews(BP,美国生物科学数据库) 主要收录生命科学和生物医学有关的文献,是生命科学科研人员不可缺少的参考文献数据库。

(11)PubMed 主要收录全世界基础医学、临床医学、环境医学、营养卫生、职业病学、卫生管理、医疗保健、微生物、药学、社会医学等方面的文献。

(12)中国生物学文摘数据库(CBA) 主要收录中国的从1985年以来的有关生物学领域的文献。

(13)北京农业数字信息资源中心 主要收录与农业有关的文献,比如专家库、政策法规、农业专利、农业标准、农业栽培、农业成果、病虫防治等十多种门类。

(14) Social Science Citation Index(SSCI,社会科学引文索引) 类同SCI,主要收录社会科学领域中多种具有影响力的学术刊物中的文献。

(15)Arts&Humanities Citation Index(A&HCI,艺术人文引文索引) 主要收录艺术人文领域中多种具有影响力的学术刊物中的文献,比如语言、文学、哲学、亚洲研究、历史、艺术等方面内容的文献。

(16)全国报刊索引 主要收录中国国内报纸、期刊方面的文献。类似的还有《人民日报索引》、《文汇报索引》、《光明日报索引》、《解放军报索引》、《中国青年报索引》等。

(17) OCLC First Search 由OCLC的First Search联机信息检索服务提供给用户的一个便捷、友好、世界性的参考资源,可检索70多个数据库中的文献,涵盖了科学研究领域中的各个学科。

互动区

亲自访问上述文摘型数据库的检索界面并学习体验。

1.8.6.2 全文型数据库

全文型数据库中的文献信息项,除了包含文摘型数据库中的全部信息外,还提供了电子版本的文献全文。文摘型数据库一般是免费的,但全文型数据库一般是有偿使用的,并且除了常见的html和pdf格式的全文外,有的数据库使用专门的阅读器方能阅读全文。

中文全文数据库有十来种,基本上是有偿使用,不同的会员由于授权使用的方式不一样,使用同一数据库的不同用户所检索得到的目标文献不尽相同。

(1)万方数据库(www.wanfangdata.com.cn) 其主要收录中文类文献,主要包括中国学位论文全文数据库、中国学术会议论文全文数据库、中国标准全文数据库、中国法律法规全文数据库、数字化期刊全文数据库、会议论文文摘库、科技成果库、科教机构库、科技名人库等。具体的内容和操作查看其界面即可知晓(图1-11)。

(2)中国知网(清华同方,CNKI,www.cnki.net) CNKI(China National Knowledge Infrastructure)主要收录中国国内多种期刊、报纸、优秀博士硕士论文、优秀图书、学术会议、百科全书、软件、专利、年鉴、标准、科技成果、政府文件、互联网信息总汇,以及其他各类加盟数据库等的文献资源(图1-12)。与万方相比,其还收录了党和国家大事、科普知识、文艺作品、文化知识、学习教育仓库、行业知识仓库等资源。具体的内容和操作只需查看其界面即可知晓,阅读其全文需要使用专门的阅读器CajViewer(其也能打开pdf格式的文件)。

img14

图1-11 万方全文数据库检索界面

img15

图1-12 CNKI中国知网全文数据库检索界面

(3)EBSCO数据库(www.ebsco.com) 该数据库包罗万象,涉及自然科学、社会科学、人文和艺术等学术领域中的文献,也类似知网和万方,具体的内容和操作只需查看其界面即可知晓。

(4)维普中文科技期刊数据库(维普数据库,www.cqvip.com) 该数据库涵盖了自然科学、工程技术、农业、医药卫生、经济、教育和图书情报等学科的中文期刊论文。

(5)人民大学复印资料全文数据库 该数据库主要涵盖社会科学、人文科学等方面的文献。

(6)中文法律专业数据库 (律商网)为目前中国市场上最为完整、全面、系统的法律法规数据库,还汇集了常用的政府部门办事表格及合同样本,提供中英文对照的每日新法速递等。

(7)ACM全文数据库 ACM(Association for Computing Machinery,美国计算机学会)数据库主要收录自1974年ACM成立以来有关计算机科学领域的专业期刊、研究及最新进展。

(8)AMS全文数据库 该库主要收录American Mathematical Society(美国数学学会,AMS)出版的电子期刊。

(9)APS数据库 该库主要收录American Physical Society(APS,美国物理学会)2006年以后的电子期刊文献,以及2005年以前的回溯文献。其中的Physical Review、Physical Review Letter、Reviews of Modern Physics等的出版物是物理领域最受敬重、被引用次数最多的期刊。

(10)ASME数据库 ASME(American Society of Mechanical Engineers,美国机械工程师学会)数据库主要涵盖能量转换、能量资源、环境和运输、一般工程学、材料和结构、材料储运工程、设备工程和维护、加工产业、制造工程学、防治工程学、计算机在工程中的应用、设计工程学、动力系统和控制、电子和电子封装、流体动力系统和技术、信息存储和处理系统等。

(11)Cell Press数据库 该库主要收录生物工程学科方面的权威性的学术期刊的文献。

(12) Elsevier全文数据库(http://www.sciencedirect.com) 即Science Direct全文数据库,其收录的文献涵盖23个学科,具有很高的权威性(图1-13)。

img16

图1-13 Elsevier检索示例

(13)Emerald电子期刊 该库主要收录管理学、工程学、图书馆学方面的文献,收录的文献可回溯到1898年。

(14)IEEE/IEE Electronic Library(IEL) 该库主要收录1988年以来美国电气电子工程师学会和英国电气工程师学会出版的期刊、会议录、标准等文献。

(15)IOP数据库 英国皇家物理学会(Institute of Physics,IOP)数据库主要收录Journal of Physics A—E在内的30多种物理学领域的核心刊物的文献,文献可回溯至1874年。

(16)JSTOR过刊数字化全文库 Journal Storage数据库主要收录政治学、经济学、哲学、历史等人文社会学科方面的文献,文献可回溯到1665年。

(17)LEX IS-NEXIS全文数据库 该库主要收录新闻、法律、政府出版物、商业信息、社会信息等方面的文献,尤以法律法规方面出色。对大学法学院、律师、法律专业人员等有重要参考价值。

(18)Nature 该库主要收录报道全球科技领域里最重要的突破性、革命性、飞跃性的成果。

(19) cnpLINKer开放获取期刊数据库 该库主要收录国外1 000多家著名出版社的1.8万多种期刊的目次和文摘信息,并保持更新,其中有一部分可免费下载全文。

(20)RSC数据库 该库主要收录英国皇家化学学会出版的刊物,文献可回溯到1997年。

(21)Springer LINK全文电子期刊 该库主要收录建筑和设计、行为科学、生物医学、生命科学、商业经济、化学、材料学、计算机科学、地球和环境科学、工程学、人文社科法律、数学统计、医学、物理学、天文学等十多个专业领域中的文献。

(22)Wiley-Blackwell期刊全文数据库 该库收录了自然科学、社会科学、医学、护理学等领域共18个学科的文献。

互动区

尝试找到并访问上述全文型数据库,并体验实际的检索操作和获取原文。

1.8.6.3 专利全文数据库

检索专利文献,可以获得一些重要的技术信息(比如检索某药物的专利文献,可以获得合成该药物的工艺路线这一重要的技术信息),可获知是否具有新颖性,是否侵权,专利法律状态是保护中还是已公开失效等。如果能有效地利用专利文献,有研究结果认为能节约40%以上的科研开发经费,少花60%的研究开发时间。以下是一些重要的专利数据库。

(1)中国国家知识产权局专利数据库(http://www.sigpo.gov.cn) 该库收录了自1985年以来的专利文献,涵盖了专利有关的新闻动态、政策法规、专利管理、专利知识讲座、专利数据统计与检索,以及跟国外专利数据库的链接(图1-14)。

img17

图1-14 中国国家知识产权局专利检索示例

(2)欧洲专利局数据库(http://ep.espacenet.com) 该库收录了70多个国家和地区的专利信息,专利说明书全文为pdf格式,提供快速、高级、分类检索等功能。

(3)美国专利数据库(http://www.uspto.gov) 该库收录了自1790年以来出版的所有授权的美国专利说明书扫描件,以及1976年以后的全文及图形专利说明书,且每周更新一次,可免费查找专利说明书。

(4)德温特专利数据库 该库收录了世界上40多个专利机构的专利文献,文献可回溯到1963年。

(5)加拿大专利数据库 收录了70多年以来的加拿大专利文献,全文为pdf格式。

(6)日本特许厅网站专利数据库 收录了自1976年以来日本已公开的专利文献。

(7)世界知识产权组织数据库(WIPO) 网上检索的包括1997年以后公开的专利,提供免费检索和说明书全文免费下载,但须先注册用户名方能使用。

互动区

尝试找到并访问上述专利数据库,并进行实际的检索操作和查看专利说明书。

1.8.6.4 学位论文全文数据库

中国的学位论文数据库,主要收录优秀硕士学位论文、优秀博士学位论文。目前万方数据库和中国知网数据库均有收录,其检索方式同前。而国外的,最重要的是美国提供的博硕论文数据库Pro-Quest Digital Dissertations,主要收录来自美国、加拿大、欧洲等1 000多所大学的博硕学位论文,文献可回溯到1861年。

互动区

尝试通过您所在的单位的检索入口,体验学位论文的检索操作并获取您所需要的论文。

1.8.6.5 会议全文数据库

会议文献传递的信息比较及时,能及时反映科学技术中的新发现、新成果和发展趋势。目前中文常见的有万方和中国知网的会议论文全文数据库,其检索和操作同前。国外的主要有以下几种。

(1) IEEE/IEEElectronic Library(IEL,http://ieeexplorer.ieee.org)。该库收录了美国电气电子工程师学会和英国电气工程师学会出版的8 000多种会议录,涵盖多个学科领域,位居世界第一。

(2)国际光学工程学会(SPIE Digital Library,http://spiedigital library.org)。该库收录了自1963年以来由SPIE参与的会议论文,集中在物理光学、机器人、计算机等领域,是光学及其应用领域科技人员重要的情报源。

(3)美国土木工程师学会在线会议录数据库(ASCE,http:// www.asce.org)。

(4)美国物理学会A IP会议录数据库(http://www.aip.org)。

(5)美国计算机协会ACM会议录数据库(http://www.acm.org)。

互动区

尝试访问上述会议全文数据库并检索体验。

1.8.6.6 图书报纸全文数据库

(1)超星数字图书馆(http://book.chaoxing.com)。中国目前最大的数字图书网,收录的图书数量和种类多,有偿使用,且需要安装超星阅读器方能阅读和下载图书(图1-15)。

img18

图1-15 超星数字图书馆图书检索

(2)书生之家数字图书馆。其主要侧重于教材、教参、考试、文艺、经管类图书。

(3)方正Apabi电子图书馆。主要收录文艺、教辅、计算机、经管、医药卫生、生活休闲、英语、法律等方面的图书。

(4)中国数字图书馆。其收录的图书涵盖整个社会科学、自然科学领域,阅读和下载全文需要安装CDL阅读器。

(5)NetLibrary电子图书。收录了全世界300多家出版社的图书,涉及自然科学、人文科学各个领域,还包含了学术性强的专著以及最新出版的各类图书。

(6)Springer Link电子丛书。涵盖了化学、计算机、生命科学、医学、物理、天文等十多个学科领域的图书。

(7)The Encyclopedia of Catalysis催化大全。

(8)Ullmann's Encyclopedia of Industrial Chemistry乌尔曼化学工业大全。

(9)Kirk-Othmer化学工艺大全。

(10)Encyclopedia of polymer Science&Technology聚合科学与技术大全。

(11)e-EROS Encyclopedia of Reagents for Organism Synthesis有机合成大全。

(12) The Wiley Database of Polymer Properties聚合物属性数据库。

(13)SafariSM Tech Books Online。主要收录编程、网络、操作系统等IT方面的图书。

(14)Knovel电子工具书。涵盖了顶级科学和工程学参考工具书、数据库和会议录,是一款不可或缺的研发工具。

(15)Ebrary电子图书。该图书网涵盖了人文科学、社会与行为科学、商业与经济、计算机、技术与工程、生命与自然科学等方面的图书,须使用Ebrary Reader专业阅读软件阅读,只能在线阅读和部分打印,不能下载全文或打印全书。

(16)The National Academies Press电子图书(NAP)。主要收录美国国家科学院、国家工程院、医学研究所、国家研究委员会的报告,涵盖了环境科学、生物学、医学、计算机科学、地球科学、数学和统计学、物理、化学、教育学等多领域的图书。可免费在线阅读,全文检索,一次打印一页,无须使用专用阅读软件。

(17)人民大学复印资料全文数据库。该库收录的有中国国内公开发行的多种报纸全文。

(18)Access World News世界各国报纸全文库(http://infoweb.newsbank.com)。该库收录了世界各地4 000多份报纸,涵盖各个领域,以英语为主,还有一定数量的其他语言比如西班牙语、法语、德语等。比如《Financial Times》(《金融时报》)、《Times》(《泰晤士报》)、《Washington Post》(《华盛顿邮报》)、《New York Times》(《纽约时报》)等。

(19)Business News Bank商业信息全文库。该库收录了美国500多种报纸,商业杂志,期刊,有线服务有关的公司、行业和经理人方面的全文。利用该库可以获得海外商业投资、新兴商业潮流以及全球经济等方面的重要资讯。

互动区

尝试访问上述图书报纸全文数据库并检索体验。

1.8.7 知识发现

检索文献的最终目的是从中发现有用的知识和信息,在它们的基础上提出新的科学假设或猜想,找到科研项目的立项点。如果能从文献中发现隐含的信息和联系,这种联系可能是横向的也可能是纵向的,也许这样的发现就是科学研究的突破口,或能使科学研究少走弯路,避免误入歧途。但要想发现这些有价值的信息和联系,很难通过前述的常规文献检索来达到,那有什么途径方法可以达到呢?

1.8.7.1 文献计量法

该法最早于1969年由英国人A.普理查德提出,是借助文献的各种特征的数量,采用数学与统计学方法来描述、评价和预测科学技术的现状与发展趋势的图书情况学分支学科。它又分为以下几种方法。

(1)引文分析法 即对科学期刊、论文、著者、研究机构等对象的引用和被引用的事实进行统计分析,以揭示其数量特征和内在规律的一种文献分析研究方法。比如某篇科技论文的被引频次高,则可说明该论文对该学术领域具有领跑者的作者;比如针对某对象的从时间上纵向比较文献,可发现该对象到目前被研究到什么阶段;比如对基因组相关文献的纵向分析,可发现对基因组研究发展到后基因组时代。

对于引文分析法,目前常采用引文率、影响因子IF、引证系数、被引证系数、同被强度、共引强度等定量指标来测度,可以借助计算机技术的帮助来统计分析,比如“科学引文索引SCI”、“期刊引用报告JCR”、“中国引文数据库”等工具。

(2)H指数法该法 于2005年由美国物理学家乔治·希尔施(Jorge Hirsch)提出,此法考虑了某研究者的论文数量及其被引用的次数,即用于评估研究人员的学术产出量与学术水平。H越高,比如大于100以上,则表明该研究者的学术水平和成就高。

互动区

选择您喜欢、感兴趣的一位诺贝尔奖获奖科学家,检索其发表论文的数量,以及其论文被引用的情况,然后与大家分享您的结果和评价。

1.8.7.2 内容分析法

该法于20世纪50年代由美国学者贝雷尔森(Berelson)提出,后来由约翰·奈斯比特(John Naisbitt)完善。其是对各种信息载体上的内容进行客观、系统描述和分析,将文字表示的资料转换为数量表示的资料的形式化方法,也即从文献横向联系中发现有价值的信息。该法在社会科学和自然科学领域都适用,它的分析过程包括3个基本环节。

(1)文献样本抽样 根据您自己的研究目的,确定如何抽样,比如按作者抽样、按关键词抽样等,有多种抽样依据。

(2)确定分析单位 常用的分析单位有词汇、主题等。比如以“转基因”为主题词进行分析,可以发现该技术的发展历程、发展阶段,以及人们对其的反应反响和认识程度如何。

(3)文献内容数量化 包括对某种信息出现的次数进行计量,对某种信息在载体中出现的位置、篇幅大小进行计量等。比如处于新闻报纸中的头条,则给高分,大篇幅广泛报道,给高分,反之则给低分,最后总计分析。

1.8.7.3 聚类分析法

又称群分析法、集分析法,即以大量对象的测量或计量为基础,将具有相似性的信息对象组合为同一类的定量研究方法,其主要目的是归类以发现趋势和现状,而不是得出什么具体的结论。该法是从宏观的角度,全面考察整个研究领域,从而发现不同的研究方法,并将研究方法加以分类,使该领域的研究人员对自己所从事的科研工作有一个更加广泛地了解,发现与自己的研究课题相关的其他研究分支,从而推动自己的科研工作和事业,所以在科研选题或者确立科研方向上很有价值。该法使用的数据量大,一般非人力所能,需要用计算机辅助,比如可使用一些聚类分析软件如“聚类分析软件V1.2”和“SPSS V20.0”。

1.8.7.4 专利技术分析法

该法旨在从技术层面了解某专利技术的分布情况,以确立技术开发的方向,避开竞争对手的“专利陷阱”,有助于企业做出技术研发决策;而对于科研工作者来说,既可参考其中的方法,还可避免一些重复和无意义的研究。通过专利文献纵、横向的分析,以发现隐含的价值信息。比如中国的很多药企通过了解国外的专利,开发很多仿制药;江苏小天鹅集团也是了解多个国家4 000多件专利,然后进行综合和自我创造,成为了行业龙头。

(1)技术机会分析法(Technology Opportunity Analysis,TOA法)。该法属于定性分析方法,用于发现专利技术的走势,一般包括如下4个步骤。

1)搜索相关文献和数据。

2)计数。利用相关软件进行编辑、计算、排列搜索结果,然后进行分析。比如计算某关键词的频率,可以发现其所对应的主题是在升温或降温。

3)分析联系。利用分析软件或者个人人工分析,追踪一段时间内的专利变化情况,主要注视正在出现的新事物,以及识别谁是某个领域最活跃的。

4)结果表示。将结果转换成图形直观化表示,然后思考从中能得出什么样的有价值线索。比如通过移动储存介质的专利检索分析,可发现其技术趋势是向大容量高密度发展;同理,对于CPU芯片,是向高速和多核方向发展。

(2)专利地图法。即将与专利有关的各种资料信息(比如数量、时间、类别、专利权人、专利权国、专利权地区等)加以统计分析后,再整理转换为可解读的图表形式,使其具有类似地图指向功能。本法在体现专利技术的趋势和区域分布情况方面功能独到,可为企业指明技术发展方向,对竞争对手做到知己知彼。但要制作专利地图,需要相关技术领域的专家参与,也可辅助分析工具软件“专利搜索引擎”来进行,或者委托专业机构如上海汉光知识产权数据科技有限公司。

互动区

如果您想设计一款产品和从事某方向的技术研究,请检索分析该方面的专利现状,然后您下一步该怎么办?

1.8.7.5 不相关文献间的联系

前述4种方法中,文献之间具有关联性,一般还是能够通过相关方法发现它们之前的一些有价值的联系。但对于表面上就不相关的文献,如何才能发现它们之间隐含的有价值的联系,就有难度了,这就有赖于您的知识面和精力投入程度了。比如鱼油是食品,雷诺氏病是一种血液循环紊乱疾病,二者表面上是不相关的。但研究发现,食用鱼油可以改善血液学指标,发生雷诺氏病的其血液学指标有异常,通过血液学指标这中间联系,最后发现了新的价值线索“食用鱼油对雷诺氏病患者有益”,此发现最后被临床所证实。

【注释】

[1]唐·贾岛《剑客》诗:“十年磨一剑,霜刃未曾试。今日把示君,谁有不平事?”

[2]英国广义相对论和宇宙论家,发现黑洞辐射,罹患肌肉萎缩症,丧失行走和发音能力。

[3]瑞典著名化学家,炸药发明人,忍着心绞痛和心脏病的折磨从事科研,一生获350项发明成果。

[4]比如有趣的陨星碰撞说、气候变迁说、物种斗争说、大陆漂移说、地磁变化说、被子植物食物中毒说、酸雨水中毒说、太阳系演变和突发事件说等。

[5]正常成人血红蛋白量男性为120~106 g/L,女性为110~150 g/L;红细胞数男性为400~550万个/立方毫米,女性为350~500万个/立方毫米。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈