关于PageRank的总结
好久不用CSDN,最近想给带的本科生实验课开个期末习题专题页,发现CSDN的博客忽然要绑定之类。只好弃用回博客园写学习总结了。塞翁失马焉知非福。
**************************************
权重网络基本对应着社交计算里的大部分知识点,最近把借的几本书的重点扫一遍还清积压的债务。
网页之间的链接关系可看作一个有向图。所谓Page Rank公式
PR(u)=∑(PR(v)/L(v)),
其中L(v)是出度。文字描述一下,就是说网页的质量如果不考虑恶意刷RANK,正常情况是链入的每页页面的Page Rank除以每页各自链出的次数,然后求和,就是每个页面的质量。由此我们可以得到一个初始转移矩阵。而经过几次迭代,PR值会逐渐趋于稳定。
但是实际上,很多网页没有出度链接,因此会有排名泄漏的问题;没有入度链接,会有排名下沉问题。因此常引入阻尼系数d,一般为0.85,来表明用户如果停止点击,随机转到其他网页继续查阅的概率。因此公式变为:
PR(u)=(1-d)/N+d∑(PR(v)/L(v)),
N是所有网页的数目。实际中N常常默认为1。
**************************************
另外虽然感谢还有博客园的平台,但不得不说博客园的编辑器是否数学公式的添加更加易用一些。
己所不欲勿施于人;练兵先练将
【推荐】还在用 ECharts 开发大屏?试试这款永久免费的开源 BI 工具!
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 软件产品开发中常见的10个问题及处理方法
· .NET 原生驾驭 AI 新基建实战系列:向量数据库的应用与畅想
· 从问题排查到源码分析:ActiveMQ消费端频繁日志刷屏的秘密
· 一次Java后端服务间歇性响应慢的问题排查记录
· dotnet 源代码生成器分析器入门
· 软件产品开发中常见的10个问题及处理方法
· 互联网不景气了那就玩玩嵌入式吧,用纯.NET开发并制作一个智能桌面机器人(四):结合BotSharp
· Vite CVE-2025-30208 安全漏洞
· MQ 如何保证数据一致性?
· 《HelloGitHub》第 108 期
2015-12-05 12月5日笔记