1.PageRank
(1)一个无监督算法:Page Rank,做搜索引擎,大数据处理
(2)基于:引用分析
(3)基本思想:
①一种链接分析算法
对超链文档集合的每个文档指定一个数值权重(numerical weighting)
以度量该文档在集合中的相对重要度
②对网页排序:
仅仅通过Web的拓扑结构(topological structure)
③如何排序:
入链(inlink)的数目:页面A到B的链接,看作是A对B的一个投票
页面不是同等重要的
循环
作者:西伯尔
出处:http://www.cnblogs.com/sybil-hxl/
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利。