首页 理论教育 雅虎:全球领先搜索服务商

雅虎:全球领先搜索服务商

时间:2023-08-02 理论教育 版权反馈
【摘要】:1.简介雅虎(Yahoo!最早以人工分类和网址收集见长,后斥资26亿美元收购了Inktomi、Overtune、Fast、Alta Vista、Kelkoo等五家国际知名搜索服务商,用一年多时间打造出雅虎搜索技术。凭借其遍布全球的网站渠道,可以支持38种语言搜索,其中雅虎中国网站是Yahoo!通过雅虎的分类目录逐级查询,可以得到一组通过主题组织在一起的网站。

雅虎:全球领先搜索服务商

1.简介

雅虎(Yahoo!)(http://www.yahoo.com.cn)由美国斯坦福大学电机工程系的两位博士生大卫·费罗(David Filo)和杨致远(Jerry Yang)创建。1994年4月,他们建立了自己的网络指南信息库,很快就将Yahoo!变成了一个可定制的数据库,开发了可定制的软件,旨在帮助互联网用户有效地查找、识别和编辑互联网上存贮的信息资源。在查找过程中尤其以其目录式分类查询闻名。

Yahoo!最早以人工分类和网址收集见长,后斥资26亿美元收购了Inktomi、Overtune(全球最大搜索广告商务提供商)、Fast、Alta Vista、Kelkoo(欧洲第一大竞价网站)等五家国际知名搜索服务商,用一年多时间打造出雅虎搜索技术(YST技术)。

Yahoo!凭借其遍布全球的网站渠道,可以支持38种语言搜索,其中雅虎中国网站(www.yahoo.com.cn)是Yahoo!公司为全球中文读者开发的网站,于1999年9月正式开通。雅虎中国网站是Yahoo!在全球的第20个网站,支持全文检索和新闻检索,可以检索国标码简体字、大五码繁体字、图形中文等中文网页。2005年8月,该网站被阿里巴巴全资收购,现在的核心业务仍是搜索。

2.Yahoo!的检索方法

(1)搜索语法

1)Yahoo!索引擎不区分英文字母大小写

用户输入的关键词无论是大写还是小写字母,得到的搜索结果都是相同的,如输入“yahoo”或“YAHOO”会得出相同的搜索结果。

2)Yahoo!搜索的默认设置包含输入的所有关键字

在Yahoo!中逻辑“与”的表达方式为半角的加号“+”,用以限定关键字一定要出现在检索结果中。因为Yahoo!搜索的默认设置包含输入的所有关键字,所以也可以以空格代替。如搜索有关“搜索技巧”方面的文献信息,则可以用“搜索技巧”或“搜索+技巧”进行搜索。

如果要限定关键字一定不出现在结果中,即想去除一个关键字,就要在这个词前输入“-”,而且减号之前必须留一空格。如要找有关《七剑下天山》方面的信息,但不想要关于电视剧《七剑下天山》的信息,则可以用“七剑下天山—电视剧”进行搜索。

3)短语检索

用户可以利用双引号检索完全符合其中词或词组的网站。

4)指定关键词的位置

“t:”用于关键词前,可用于搜索网站名称。(www.xing528.com)

“u:”用于在关键词前,搜索引擎仅会查询网址(URL)。

(2)检索方法

1)关键词检索

在雅虎主页或是经由类目搜索进入的检索页面上,只要在搜索框中输入搜索用的关键字,点击“搜寻”按钮,即可进入搜索结果页面。比如要查找某个网站,可直接在搜索框中输入网站名称,最好使用网站全名进行检索。

雅虎的高级搜索(http://misc.yahoo.com.cn/advanced.html),主要包括专业文档搜索(搜索.pdf、.doc、.ppt等文档)、站内搜索(在http://……站内搜索)、按时间范围搜索和按语言搜索。

2)分类目录式查询

Yahoo!中国首页(www.yahoo.com.cn)包含Yahoo!中国目录下14个主类目的链接,分别是:艺术人文商业经济电脑与互联网、教育、娱乐、政府与政治健康与医药、新闻与媒体、休闲与生活、参考资料、区域、科学、社会科学、社会与文化。如果分类类目后面有“@”,则表示这个类目同时出现在多个Yahoo!中国的分类类目下面,点击这个类目链接会找到放置这个类目的主要类目。

通过雅虎的分类目录逐级查询,可以得到一组通过主题组织在一起的网站。当用户对自己的搜索目标不太明确时,用这种查询方法非常有效。

3)分类目录与关键词组合检索

通过关键词检索得到搜索结果后,如果点击结果找到一个非常适合自己需要的网站,则可以点击该网站所在的类目,得到所需要的一组相关网站。

(3)搜索结果

发出搜索指令后,Yahoo!会检索Yahoo!分类类目和索引库中的网站信息,并根据分类类目及网站信息和查询字串的相关程度列出相关的类目和网站。和关键字串相同的字串越多,Yahoo!认为相关程度愈高;如果搜索结果与关键字串完全匹配,则系统会认为其相关程度高于部分匹配;另外搜索结果与关键字串符合的字串位置也会对相关度产生影响,比如如果网站名称(或新闻标题)与关键字串匹配,则系统会认为这些网站的相关程度比网址(或新闻内文)中含有关键字串的网站要高。

对新闻检索而言,新闻更新的时间也是搜寻结果排序的考虑要素,最近更新的新闻将优先被列出。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈