按照信息搜集方式和服务提供方式的不同,搜索引擎可以分为以下四大类。

1.分类目录式搜索引擎

分类目录式搜索引擎以人工方式或半自动方式收集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中,信息大多面向网站,提供目录浏览服务和直接检索服务。该类搜索引擎的特点是信息准确、导航质量高;缺点是需要人工介入、维护量大、信息量大、信息更新不及时。这类搜索引擎的代表是搜狐(Sohu)。

2.机器人搜索引擎

机器人搜索引擎由一个称为“蜘蛛”的机器人程序以某种策略自动地在互联网中收集和发现信息,由索引器为收集到的信息建立索引,由检索器根据用户的查询输人检索引库,并将查询结果返回给用户。其服务方式是面向网页的全文检索服务。该类搜索引擎的优点是信息量大、更新及时、无须人工干预;缺点是返回信息过多,有很多无关信息,用户必须从结果中进行筛选。这类搜索引擎的代表是谷歌(Google)、百(Baidu)等。

3.元搜索引擎

元搜索引擎没有自己的数据,而是将用户的查询请求同时向多个搜索引擎递交,返回结果进行重复排除、重新排序等处理后,作为自己的结果返回给用户。其服务方式为面向网页的全文检索。这类搜索引擎的特点是返回结果的信息量更大、更全,但不能够充分使用搜索引擎的功能,用户需要做更多的筛选。这类搜索引擎的代表是Web Crawler、InfoMarket等。

4.集成搜索引擎

集成搜索引擎功能最简单,它无须专门的核心技术,也没有自己的索引数据库,甚至不能对结果进行筛选和重新排序,只是在一个浏览页面上同时连接了多个搜索引擎用户检索时可以选择其中的部分或全部搜索引擎,一次输入关键词,可以获得多个搜索引擎的检索结果。

(本文内容根据网络资料整理,出于传递更多信息之目的,不代表连连国际赞同其观点和立场)