首页 理论教育 信息资源和搜索引擎应用

信息资源和搜索引擎应用

时间:2023-11-17 理论教育 版权反馈
【摘要】:网络的广泛应用和发展,使世界范围内的信息交流、信息资源共享成为现实。图1-3-2Google 产品在专门的教育资源类网站中,也常常使用目录检索工具。图1-3-3高等职业教育优质教学资源全库2.搜索引擎搜索引擎使用自动索引软件来发现、收集并标引网页、建立数据库。例如,由于人工干预过少,其准确性较差,检索结果中可能会有很多冗余信息。

信息资源和搜索引擎应用

网络的广泛应用和发展,使世界范围内的信息交流、信息资源共享成为现实。它打破了对时空的限制,拓展了人类信息的空间。但由于缺乏统一的组织和控制,网络上的信息纷杂,要想从大量纷繁复杂、千变万化的信息海洋中及时、准确地找到并获取所需的信息,就需要借助各种类型的网络信息检索工具。一般来说,网络信息资源包括网络信息检索工具和学术数据库,而网络信息检索工具主要可以分为目录检索工具和搜索引擎两大类。

1.目录检索工具

目录检索工具是由信息管理专业人员在广泛搜集网络资源并进行加工整理的基础上,按照某种主题分类体系编制的一种可供检索的等级结构式目录。在每个目录类下提供相应的网络资源站点地址,使用户能通过该目录体系的引导,查找到有关的信息。

目录检索工具的主要优点是所收录的网络资源经过专业人员的选择和组织,可以保证质量,减少了检索中的“噪声”,从而提高了检索的准确性。但是由于人工收集整理信息,得花费大量的人力和时间,难以跟上网络信息的迅速发展,涉及信息的范围有限,其数据库的规模也相对较小。

目前最有代表性的目录检索工具是Google 中的“Google 产品”(如图1-3-2所示),“Google 产品”的一级目录中有“搜索服务”“探索与创新”“分享与沟通”等,一级目录下有二级目录,然后逐级链接多级目录,最后与相应的Web 页相连。如“搜索服务”“网页目录”“科学”“计算机信息科学”“人工智能”“中国人工智能网”。

图1-3-2 Google 产品

在专门的教育资源类网站中,也常常使用目录检索工具。如高等职业教育优质教学资源全库(httpa//glibdemo.cctr.net.cn/),如图1-3-3所示,注册后即可登录获取所需资源。

图1-3-3 高等职业教育优质教学资源全库

2.搜索引

搜索引擎使用自动索引软件来发现、收集并标引网页、建立数据库。以网页形式提供给用户一个检索界面,供用户输入检索关键词、词组或短语等检索项。代替用户在数据库中查找出与其提问匹配的记录并返回结果,且按其相关度排序输出。

一方面,使用搜索引擎检索时,无须判断类目、归属,使用比较方便;另一方面,搜索引擎也存在一些缺陷。例如,由于人工干预过少,其准确性较差,检索结果中可能会有很多冗余信息。

(1)搜索引擎的工作原理

搜索引擎的工作过程主要包括信息采集与存储、加工、输出等。

①信息的采集与存储。搜索引擎一般采用自动方式收集和存储信息,即运用Robots、Eqiders、Worm 等被称为“网络机器人”“自动跟踪索引机器人”或“自动跟踪索引软件”的智能型软件,追寻环球信息网(WWW)上的链接向前搜索,找到Web 页并将其调出。搜索引擎软件将自动给该Web 页上的某些或全部词做上索引,形成目标摘要格式文件,然后填入网络可访问的数据库。

②加工(信息索引的建立)。信息采集和存储后,要建立索引查询系统。它是一个同建库系统配套的子系统,建立信息索引就是创建文档信息的特征记录,使检索者能够快速地检索到所需信息,主要进行信息语词区分和语词词法分析、词性标注及相关的自然语言处理、建立检索项索引等处理。

③输出(相关性处理并建立索引界面)。一般情况下,网上信息检索的结果往往很庞大,大量的结果信息使检索者无法逐一浏览。因此,搜索引擎还根据文件的相关程度进行排列,最相关的文件通常排在最前面。一般而言,每个搜索引擎确定相关性的方法不尽相同,其中有概率方法、位置方法、摘要方法、分类或聚类方法等。搜索引擎检索界面用于接受用户提交的查询请求,从而进一步找寻相应的Web 页地址。

(2)搜索引擎检索的基本方法

网络信息的检索有多种方法。因此,可以根据所检索内容的不同,选择合适的检索方法。

①布尔逻辑检索。常见的有“与”(and)、“或”(or)、“非”(not)等。不同的搜索引擎对该功能的支持程度有所不同,有的是“完全支持”全部以上逻辑运算。另外,在提供运算符号方面也有所区别,有些搜索引擎采用常规的命令驱动方式,即用逻辑运算符进行逻辑运算,有的则采用符号“+”和“-”分别代替“and”和“not”。

②截词检索。常用的截词方法有左截、右截、中间截断和中间屏蔽四种。通常只提供右截法,而且搜索引擎的截词符通常采用星号“∗”。例如,educat∗相当于education、educational、educator 等。

③短语检索。在搜索词中将一个短语当作一个独立单元,进行严格匹配,以提高检索的精度和准确度。短语检索不仅规定搜索引擎支持词组的检索,并且采用双引号来强调短语,如“教育技术”。

④自然语言检索。直接采用自然语言中的字、词或句子提问式进行检索。

⑤多语种检索。提供多语言种类的检索环境供检索者选择,系统可按指定的语种进行检索,并输出相应的检索结果。

⑥区分大小写的检索。主要针对检索词中含有人名、地名等专有名词的检索。

•知识拓展

搜索小技巧

(1)选择合适的关键词。

(2)学会使用各种逻辑符号“and”“or”等,扩大搜索的范围。

(3)分类目录加关键词混合检索。

(4)网页快照。当无法打开某个搜索结果或者打开速度特别慢时,可以使用网页快照。

(5)文档类型限定。可在文件名后跟上文件格式,如“DOC、PPT、PDF”等;也可以根据文档类型搜索,如在Google 中选取“视频”“图片”“音乐”等类型。

(6)用搜索引擎检索到相关网页后,有时会发现所要的文件并没有出现在当前屏幕中,可按“Ctrl+F”组合健,在“查找”对话框中输入待查找的关键词,以便在当前网页中查找相应的内容。

(7)在信息检索中,当一个很长的网址连接不上时,可以试试“右切断网址”的方法,从右至左依次删除网址中抖杠后面的内容,直至链接成功。

3.学术数据库

专业网络教学信息资源的检索主要指的是学术数据库。因此,下面对国内外主要的专业学术数据库进行介绍。

(1)国内主要专业学术数据库

①维普资讯网(http://www.cqvip.com/)(www.xing528.com)

该网是重庆维普资讯有限公司开发研制的中文电子期刊数据库,收录了1989年以来我国自然科学工程技术农业科学、医药卫生、经济管理教育科学和图书情报等学科12 000余种期刊的1700余万篇文章的全文,并以每年100万篇的速度递增。

维普资讯网快速检索方法:通过首页中的输入框,输入简单检索条件,在任意字段进行查询。

进入结果显示页面,可实施题录文摘的查看或下载,及全文下载功能,同时也可进行检索条件的在限制检索或重新检索。

②CNKI 中国知网(http://www.cnki.net/)

该网主要应用包括中国期刊全文数据库、中国优秀博士硕士论文全文数据库、中国重要报纸全文数据库、中国医院知识仓库、中国重要会议论文全文数据库。

中国知网为用户提供了在线的使用指南。其个人数字图书馆使用手册网址为http://epub.cnki.net/grid2008/Help/gerenguan/index.html。

超星数字图书馆(http:/www.ssreader.com/)

超星数字图书馆设文学历史法律军事、经济、科学、医药、工程、建筑交通、计算机和环保等几十个分馆。目前拥有数字图书10多万种,包括51 个学科分类,涉及哲学宗教、社科总论、经典理论、民族学经济学、自然科学总论、计算机等各个学科门类。收录年限为1977年至今。检索方法如下。

a.下载安装超星阅览器。

下载地址:http://www.ssreader.com/download/download.html。

b.下载、安装后启动超星阅览器,进行新用户注册。

新用户注册网址:http://reg.ssreader.com/reg.asp。

c.登录电子书店网址:http://ebook.ssreader.com,查找需要的图书。

d.图书搜索(如图1-3-4所示)。

图1-3-4 图书搜索图

e.图书分类查找。在网页的左侧可以通过图书分类查找。

④中国国家数字图书馆(http://www.nlc.gov.cn/)

目前,国家数字图书馆已在因特网上发布72 万册件、馆域网上发布超过百万册件的电子书。国家数字图书馆将成为世界最大的中文文献收藏中心、中文数字资源基地和中国最先进的信息网络服务基地。

(2)国外主要专业学术数据库

①美国

a.Wiley InterScienceo。Wiley InterScience 是John Wiely & Sons 公司创建的动态在线内容服务,1997年开始在网上开通。通过InterScience,Wiley 公司以许可协议形式向用户提供在线访问全文内容的服务。Wiley InterScience 收录了360多种科学、工程技术、医疗领域及相关专业期刊,30多种大型专业参考书,13 种实验室手册的全文和500多个题目的Wiley 学术图书的全文。

b.IEEE/IEE。收录美国电气与电子工程师学会(IEEE)和英国电气工程师学会(IEE)自1988年以来出版的全部150多种期刊、5670余种会议录及1350余种标准的全文信息。IEEE (Institute of Electrical & Electronics Engineers)是电子信息领域最著名的跨国性学术团体,其会员分布在世界150多个国家和地区。

c.EBSCO。其网址是http://ejournals.ebsco.com,该公司从1986年开始出版电子出版物,共收集了4000多种索引和文摘型期刊、2000多种全文电子期刊。该公司拥有BSP(Business Source Premier,商业资源电子文献库)、ASP(Academic Search Premier,学术期刊全文数据库)等多个数据库。

d.ProQuest。它是博士论文全文,是UMI 公司的一个分库。收录了1861年以来全世界1000多所著名大学理工科160万博士、硕士学位论文的摘要及索引,学科覆盖了数学物理化学、农业、生物、商业、经济、工程和计算机科学等,是学术研究中十分重要的参考信息源。其网址是http://proquest.umi.com/pqdweb。

e.OCLC。联机计算机图书馆中心(Online Computer Library Center,OCLC),是世界上最大的提供文献信息服务的机构之一。其数据库绝大多数由一些美国的国家机构、联合会、研究院、图书馆和大公司等单位提供。数据库的记录中有文献信息、馆藏信息、索引、名录、全文资料等内容。资料的类型有书籍、连续出版物、报纸、杂志、胶片、计算机软件、音频资料、视频资料、乐谱等。

f.Netlibrary。其网址是http://www.netlibrary.com。Netlibrary 处在美国科罗拉多州波尔德尔市,于1999年成立,是世界上向图书馆提供电子图书的主要提供商。Netlibrary 于2002年1月25 日成为OCLC 联机计算机图书馆中心的下属部门。目前,世界上7000多个图书馆通过Netlibrary 存取电子图书,其中,包括哥伦比亚大学斯坦福大学、加州大学伯克莱分校,以及世界上其他成千的大小图书馆。

•知识拓展

Netlibrary 是OCLC 的一个部门,是当前世界上e-Book 的主要提供商。目前提供400多家出版社出版的60000多种电子图书,并且每月增加约2000种。这些电子图书覆盖所有主题范畴,约80%的书籍是面向大学程度的读者。大多数Netlibrary 的电子图书内容新颖,近90%的电子图书是1990年后出版的。

g.Springer。Springer 包含化学、计算机科学、经济学、工程学环境科学地球科学、法律、生命科学、数学、医学、物理与天文学这11 个学科,其中许多为核心期刊。

h.Engineering Village。Engineering Village 属于工程索引类电子文献数据库,是工程人员与相关研究者最佳、最权威的信息来源。

③英国

a.Ingenta。其网址是http://www.ingenta.com.Ingenta,网站是Ingenta 公司于1998年建成的学术信息平台。在几年的发展中,该公司先后兼并了多家信息公司,合并了这些公司的数据库。

•知识拓展

2001年,Ingenta 公司兼并了Catchward 公司,近期Ingenta 准备将两家公司的信息平台整合为一体。在整合之前,用户可分别从ingenta.com 和catchward.com 查询对方提供的全部信息。整合后可提供全球190多个学术出版机构的全文联机期刊5400多种,以及26 000多种其他类型出版物。目前,Ingenta 公司在英国和美国多个城市设有分公司,拥有分布于世界各地的10000多个团体用户和2500多万个个人用户,已成为全球学术信息服务领域的一个重要的文献检索系统。

b.Blackwell。其网址是www.blackwell-synergy.com。Blackwell 出版公司是世界上最大的期刊出版商之一,总部设在英国伦敦的牛津,以出版国际性期刊为主,包含很多非英美地区出版的英文期刊。它所出版的学术期刊在科学技术、医学、社会科学以及人文科学等学科领域享有盛誉。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈