2016年4月21日

PageRank基于Spark实现介绍

摘要: 该算法为谷歌的拉里•佩奇命名。以迭代方式,根据外部文档指向一个文档的链接来更新每个文档的权重。每个文档给它的相邻文档提供r/n的权值,其中r是该文档的rank,n表示它的邻居文档个数。通过公式a/N +(1-a)*sum(ci) 来更新rank,其中N是文档的总个数,sum(ci)是接收到的权值总和 阅读全文

posted @ 2016-04-21 16:36 who_a 阅读(2991) 评论(0) 推荐(1) 编辑

导航