摘要:
摘要:本文简要介绍和比较了目前搜索引擎所使用的排序算法,主要包括词频位置加权排序算法,链接分析排序算法,并着重介绍了PageRank算法和HITS算法的思想以及二者比较的优缺点。关键词:搜索引擎;排序; PageRank; HITS1前言Google和Baidu的崛起,很大程度上是由于他们使用了较以... 阅读全文
2015年6月19日 #
摘要:
1. 检索模型概述 搜索结果排序时搜索引擎最核心的部分,很大程度度上决定了搜索引擎的质量好坏及用户满意度。实际搜索结果排序的因子有很多,但最主要的两个因素是用户查询和网页内容的相关度,以及网页链接情况。这里我们主要总结网页内容和用户查询相关的内容。 判断网页内容是否与用户査询相关,这依赖于搜索引擎... 阅读全文
摘要:
2.1基于词频统计——词位置加权的搜索引擎利用关键词在文档中出现的频率和位置排序是搜索引擎最早期排序的主要思想,其技术发展也最为成熟,是第一阶段搜索引擎的主要排序技术,应用非常广泛,至今仍是许多搜索引擎的核心排序技术。其基本原理是:关键词在文档中词频越高,出现的位置越重要,则被认为和检索词的相关性越... 阅读全文
摘要:
第一定律 相关性定律听起来象是一篇学术论文,的确,就连第一,第二定律的提法以前也没有过,但是第一,第二定律的内容确早已在业界和学术界得到了公认。其实这第一定律是早在互联网出现之前就被学术界广泛研究过的,那就是所谓的相关性定律。这个领域那时叫情报检索,或信息检索,也有 叫全文检索的。那时的相关性都是基... 阅读全文
摘要:
搜索引擎发展到今天已经非常成熟了,并且还在高速发展中,很多学习SEO的朋友都问我,能不能教我们点搜索引擎原理。在这里我详细说一下搜索引擎三大基础定律。第一定律:相关性定律相关性定律是基于搜索引擎检索系统的,相关性定律主要是基于词频统计,当用户在搜索引擎首页输入检索词时,搜索引擎去找那些检索词在文章(... 阅读全文