首页 理论教育 著名中文搜索引擎:网上信息搜索方法

著名中文搜索引擎:网上信息搜索方法

时间:2023-08-08 理论教育 版权反馈
【摘要】:(三)著名中文信息搜索引擎搜索引擎是一个集中了千千万万个站点的地方,主要功能是给人们搜索这些站点和查找信息。目前共有15大类目录,1万多个细目和20余万个网站,是互联网上最大规模的中文搜索引擎之一。

著名中文搜索引擎:网上信息搜索方法

互联网上的信息资源很丰富,丰富得让人有点儿无所适从,尤其是对那些刚刚踏入互联网世界里来的生手,更是难以理出头绪。有人比喻互联网上的信息就如同许多堆杂乱无章的书籍,只是在每堆书籍上,列出此堆书籍中涉及的内容及书名,但要找到具体书籍则须自己不辞劳苦地翻拣了。毋庸置疑,互联网上众多的信息资源中肯定有你所需要的信息,若清楚信息的存放地址,通过在线获取这些信息是快捷而便利的,但是主要问题是如何找到这些信息。

(一)查找信息的途径

在互联网上查找信息的途径很多,大致可分为以下几种。

第一,偶然发现。这是在互联网中发现信息的原始方法。当你在互联网上遨游之时,也许会意外发现一些很有用的信息。由于这种方法的不可预见性,所以它也很有乐趣,但也许会一无所获。

第二,浏览。浏览就如同走进图书馆的书库,然后在书架上直接翻看一样。目前互联网上提供的Gopher服务就是这种方法的电子等价物。互联网提供的超文本方式可以看作是浏览的一种特殊形式。

第三,搜索。搜索就像通过索引或分类卡片来帮助查找一样。在互联网中有许多不同类型的搜索工具,如WAIS、Archie等,它们都有各自不同的搜索目的。还有许多网点则提供给用户多种组合式的搜索界面。

第四,通过资源指南来查找相应的信息。互联网上提供了成千上万个信息源和各种各样的信息服务,而且信息源和服务种类、数量还在不断、快速地增长。对这些信息源和服务,由于时间、精力和财力限制,不可能亲身尝试。上面提到的偶然发现和浏览两种方法虽然在某些场合下十分有效,但有时花费时间、效益可能不会令人太满意,而使用搜索方法则可缩小查找范围,达到事半功倍的效果。

(二)具体信息搜索步骤

1.制定信息搜索策略

在互联网上进行信息搜索时,建议采取以下几个策略:第一,确定提供相关信息的优秀信息源。第二,检查信息源所提供的信息粒度是否适中,所提供的信息量是否合适。信息量太多,冗而杂,搜索不便,信息量太少,则搜索不到足够的信息。第三,研究信息源所提供的搜索命令及搜索方法,制订搜索计划,然后开始进行搜索。

2.确定信息源

确定信息源是很关键的一步。良好的开端是成功的一半。若起点没有找准,搜索结果可能会一无所获。(www.xing528.com)

3.信息搜索方法及搜索机制

对于各个服务网点,具体搜索起来还有许多实际问题。因为不同网点提供搜索服务的实现方法不同,目前没有一个对所有在线服务都是行之有效的、简单的搜索规则。对某一服务来说是很好的方法,也许对另一个服务来说则是完全无用的。许多服务在线提供完全的搜索命令文档。当用户使用某一网点进行搜索时,应该先研究一下此服务提供的搜索命令、搜索方法及它的特色,这样才能明确如何在其上进行搜索并充分利用该网点的优势。例如,有些搜索网点允许用户在新一轮的搜索中利用上一次的搜索条件。当第一次搜索结果中满足条件的记录很多时,就可以通过增加条件进行第二次搜索,这样能够节省大量的时间和金钱。

在搜索过程中,输入搜索条件是最关键的一步。若用户对自己输入条件所期望的含义与搜索网点理解的含义不同,则所得到的搜索结果就会与自己希望得到的相差甚远。当刚开始涉足信息搜索服务时,建议采用不同单词进行试验性搜索,然后研究搜索结果的前5—10个记录,注意它们的信息头及索引,通过这种方式就可大致了解这种服务的索引项是如何组织的,下一步就清楚该用什么关键词来搜索自己想要的信息了。

不同网点所提供的搜索机制不同。布尔搜索是较普遍的一种机制。它使用AND、OR、NOT三个布尔操作符来组合搜索项。使用AND操作符组合的搜索项,每个项都必须出现在搜索结果中。使用OR操作符组合的搜索项,任一项出现在文档中,都是符合条件的。使用NOT操作符时一定要注意,它也许会把用户所希望查到的结果给筛选出去。除了布尔搜索机制外,许多在线服务提供了一些其他搜索机制。如自然语言搜索、相关等级搜索、概念搜索等。

(三)著名中文信息搜索引擎

搜索引擎是一个集中了千千万万个站点的地方,主要功能是给人们搜索这些站点和查找信息。它还会分门别类地把一些好的站点列出来,以方便人们查找资料。有了搜索引擎,就能很容易地找到所想要的内容或站点。这里简单介绍一下以下两个著名的中文信息搜索引擎。

1.新浪网搜索引擎

新浪网搜索引擎是面向全球华人的网上资源查询系统,提供网站、中文网页、英文网页、新闻、软件、游戏等查询服务。网站收录资源丰富,分类目录规范细致,遵循中文用户习惯。目前共有15大类目录,1万多个细目和20余万个网站,是互联网上最大规模的中文搜索引擎之一。采用百度搜索技术,内容丰富。支持中文域名查询。新浪搜索的检索结果是根据与查询要求相匹配的结果的质量来进行排列相关的分类目录和网站。质量越高,排列位置越靠前。其中新闻检索的结果是按日期排序,日期越新的新闻排列位置越靠前。新浪搜索提供“分类检索”和“关键词查询”两种查找方法。分类检索是从搜索首页按照树形的主题分类逐层点击来查找所需信息的方法,关键词查询是用所需信息的主题(关键词)进行查询的方法。此外,利用关键词还可以专门对网站标题和网址进行检索。网站标题搜索,在关键字前加“t:”,网站网址(URLs)搜索,则在关键字前加“u:”。

2.搜狐中文检索引擎

爱特信公司创办的大型中文网络系统,不只是一个搜索引擎,还包括新闻、工商财经体育求职、IT、娱乐、音乐、时尚女人、求职、游戏、购物、免费邮箱和BBS等频道为网民提供了网上社交场所,成为中国网络用户进入互联网的渠道之一,并且支持个性化的设置。搜索引擎系统是搜狐网站的重要组成部分,它面向全球互联网华语圈用户,提供互联网网站(以中文为主)的查询服务。采用的是百度搜索引擎技术,支持中文域名查询。利用搜狐中文检索引擎,可以通过“分类查询”和“关键字检索”两种方法查找信息。可以在搜狐类目网站搜索、网页搜索、新闻搜索、中文网址搜索4个分类中任意切换,得到所需要的检索结果。系统默认用户从搜狐网站中进行检索。搜狐中文检索的默认检索方式是精确查询方式,查询包含完全符合关键字符串的网站。搜狐中文检索系统引擎会根据分类类目及网站信息与关键字符串的相关程度来排列出相关的搜狐中文类目和网站。相关程度越高,排列位置越靠前。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈