电子商务-搜索引擎的基本原理

搜索引擎的基本原理

A.定义:搜索引擎是一种基于网络的工具,为网络使用者提供信息服务。

B.宗旨:为访问者提供准确有用的信息,使访问者通过网络方便地获取各种信息

C.分类:全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)、集合式搜索引擎、门户搜索引擎、免费链接列表。
D.工作方式:如图
搜索引擎先将网站收录至其服务器,以备随时被用户查询,这是先提条件。用户需要相关信息时,便会使用计算机通过网络,将需要查询的信息的关键字或词语输入至搜索引擎中,向搜索引擎查询,搜索引擎服务器在接收到用户的查询要求后,使会将用户输入的关键字或词语与服务器里收录的网站进行对比,如果查询到有相应的网站上有与关键字匹配的信息,使将这些网站返回给用户,并以在搜索引擎搜索页显示的方式展示给用户。

E.搜索引擎收录的方式:
1)站点人员手工提交(免费、付费)
2)搜索引擎机器的自行找到网站并自行收录

F.搜索结果显示方式:
1)付费广告显示
 此类方式,以用户竞价排名为基础,通常情况下出价越高排名越靠前。通常
付费广告会在搜索引擎(如google)的上方和右侧显示
2)自然排名显示
通过SEO,将网站进行优化,把关键字密度等关键指标进化相应的调整,使网
站或页面在自然排名靠前,从而获得相应的访问量。通常在搜索引擎的左侧显现。

G.常见的搜索引擎:
Google, Yahoo, msn, live, aol, baidu, sohu,

搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。
全文搜索引擎
全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。
从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

目录索引
目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。

元搜索引擎 (META Search Engine)
元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。
除上述三大类引擎外,还有以下几种非主流形式:

1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。
2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。
3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。

转自:http://bbs.51testing.com/

posted @ 2008-12-17 13:22  广陵散仙(www.cnblogs.com/junzhongxu/)  阅读(468)  评论(0编辑  收藏  举报