首页 理论教育 搜索引擎分类及优化方法

搜索引擎分类及优化方法

时间:2023-07-08 理论教育 版权反馈
【摘要】:1)全文搜索引擎上文提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。2)目录索引与全文搜索引擎相比,目录索引有许多不同之处。如果审核通过,网页才会出现在搜索引擎中,否则不会显示。目前,搜索引擎与目录索引有相互融合渗透的趋势。元搜索引擎在接受用户查询请求时,可以同时在其他多个搜索引擎中进行搜索,并将其他搜索引擎的检索结果经过处理后返回给用户。

搜索引擎分类及优化方法

1)全文索引

上文提到过全文搜索引擎从网站提取信息建立网页数据库的概念。搜索引擎的自动信息搜集功能分两种。一种是定期搜索,即每隔一段时间(比如Google一般是28天),搜索引擎主动派出“蜘蛛”程序,对一定IP地址范围内的互联网站进行检索,一旦发现新的网站,它会自动提取网站的信息和网址加入自己的数据库。另一种是网站提交搜索,即网站拥有者主动向搜索引擎提交网址,它在一定时间内(2天到数月不等)定向向网站派出“蜘蛛”程序,扫描网站并将有关信息存入数据库,以备用户查询。由于搜索引擎规则发生了很大变化,主动提交网址并不保证该网站能进入搜索引擎数据库,因此目前最好的办法是多获得一些外部链接,让搜索引擎有更多机会找到并自动将该网站收录。

当用户以关键词查找信息时,搜索引擎会在数据库中进行搜寻,如果找到与用户要求内容相符的网站,便采用特殊的算法(通常根据网页中关键词的匹配程度、出现的位置/频次、链接质量等),计算出各网页的相关度及排名等级,然后根据关联度高低,按顺序将这些网页链接返回给用户。

2)目录索引

与全文搜索引擎相比,目录索引有许多不同之处。

首先,搜索引擎属于自动网站检索,而目录索引则完全依赖手工操作。用户提交网站后,目录编辑人员会亲自浏览你的网站,然后根据一套自定的评判标准甚至编辑人员的主观印象,决定是否接纳你的网站。如果审核通过,网页才会出现在搜索引擎中,否则不会显示。

其次,搜索引擎收录网站时,只要网站本身没有违反有关的规则,一般都能收录成功。而目录索引对网站的要求则高得多,有时即使登录多次也不一定成功。(www.xing528.com)

此外,在登录搜索引擎时,我们一般不用考虑网站的分类问题,而登录目录索引时则必须将网站放在一个最合适的目录。

最后,搜索引擎中各网站的有关信息都是从用户网页中自动提取的,所以从用户的角度看,我们拥有更多的自主权;而目录索引则要求必须手工另外填写网站信息,而且还有各种各样的限制。更有甚者,如果工作人员认为你提交网站的目录、网站信息不合适,他可以随时对其进行调整,当然事先是不会和你商量的。

目录索引,顾名思义就是将网站分门别类地存放在相应的目录中,因此用户在查询信息时,可选择关键词搜索,也可按分类目录逐层查找。如以关键词搜索,返回的结果跟搜索引擎一样,也是根据信息关联程度排列网站,只不过其中人为因素要多一些。如果按分层目录查找,某一目录中网站的排名则是由标题字母的先后顺序决定的(也有例外)。

目前,搜索引擎与目录索引有相互融合渗透的趋势。原来一些纯粹的全文搜索引擎现在也提供目录搜索。

3)元搜索引擎

元搜索引擎(meta search engine)不是一种独立的搜索引擎,它最显著的特点是没有自己的资源索引数据库,是架构在许多其他搜索引擎之上的搜索引擎。元搜索引擎在接受用户查询请求时,可以同时在其他多个搜索引擎中进行搜索,并将其他搜索引擎的检索结果经过处理后返回给用户。元搜索引擎为用户提供一个统一的查询页面,通过自己的用户提问预处理子系统将用户提问转换成各个成员搜索引擎能识别的形式,提交给这些成员搜索引擎,然后把各个成员搜索引擎的搜索结果按照自己的结果处理子系统进行比较分析,去除重复,并且按照自定义的排序规则进行排序返回给用户。所以,一般的元搜索引擎都包括三大功能结构:提问预处理子系统、检索接口代理子系统和检索结果处理子系统。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈