关于PageRank的总结

好久不用CSDN,最近想给带的本科生实验课开个期末习题专题页,发现CSDN的博客忽然要绑定之类。只好弃用回博客园写学习总结了。塞翁失马焉知非福。

**************************************

权重网络基本对应着社交计算里的大部分知识点,最近把借的几本书的重点扫一遍还清积压的债务。

网页之间的链接关系可看作一个有向图。所谓Page Rank公式

PR(u)=∑(PR(v)/L(v)),

其中L(v)是出度。文字描述一下,就是说网页的质量如果不考虑恶意刷RANK,正常情况是链入的每页页面的Page Rank除以每页各自链出的次数,然后求和,就是每个页面的质量。由此我们可以得到一个初始转移矩阵。而经过几次迭代,PR值会逐渐趋于稳定。

但是实际上,很多网页没有出度链接,因此会有排名泄漏的问题;没有入度链接,会有排名下沉问题。因此常引入阻尼系数d,一般为0.85,来表明用户如果停止点击,随机转到其他网页继续查阅的概率。因此公式变为:

PR(u)=(1-d)/N+d∑(PR(v)/L(v)),

N是所有网页的数目。实际中N常常默认为1。

 

**************************************

另外虽然感谢还有博客园的平台,但不得不说博客园的编辑器是否数学公式的添加更加易用一些。

posted @ 2017-12-05 11:49  [6G]蓝色の云风  阅读(187)  评论(0编辑  收藏  举报