关于PageRank的总结

好久不用CSDN，最近想给带的本科生实验课开个期末习题专题页，发现CSDN的博客忽然要绑定之类。只好弃用回博客园写学习总结了。塞翁失马焉知非福。

**************************************

权重网络基本对应着社交计算里的大部分知识点，最近把借的几本书的重点扫一遍还清积压的债务。

网页之间的链接关系可看作一个有向图。所谓Page Rank公式

PR(u)=∑(PR(v)/L(v)),

其中L(v)是出度。文字描述一下，就是说网页的质量如果不考虑恶意刷RANK，正常情况是链入的每页页面的Page Rank除以每页各自链出的次数，然后求和，就是每个页面的质量。由此我们可以得到一个初始转移矩阵。而经过几次迭代，PR值会逐渐趋于稳定。

但是实际上，很多网页没有出度链接，因此会有排名泄漏的问题；没有入度链接，会有排名下沉问题。因此常引入阻尼系数d，一般为0.85，来表明用户如果停止点击，随机转到其他网页继续查阅的概率。因此公式变为:

PR(u)=(1-d)/N+d∑(PR(v)/L(v)),

N是所有网页的数目。实际中N常常默认为1。

**************************************

另外虽然感谢还有博客园的平台，但不得不说博客园的编辑器是否数学公式的添加更加易用一些。

posted @ 2017-12-05 11:49 [6G]蓝色の云风阅读(204) 评论(0) 收藏举报

刷新页面返回顶部