Search Engine + Recommendation System

PageRank

  • 该网络的 邻接矩阵 通过变换可以变成 概率转移 矩阵
    设该转移矩阵为M,最终每个节点的重要性向量为r,则有了一个状态转移方程\(M \cdot r = r\),(虽然严格意义上,应该写作 \(M \cdot r^{n} = r^{n+1}\),即一个标准的Markov过程)
  • 在随机过程中可以证明,马尔可夫概率转移矩阵的最大特征值为1, 每个节点的最终重要性向量就是 特征值为1对应的特征向量。

收敛性证明:(其实就是Markov过程收敛的条件)

设Markov过程为 \(P_{n+1} = A P_{n}\)

  • A 为随机矩阵(A矩阵所有元素大于等于0, 并且每一列的元素和都为1)
  • A 为不可约的(当图是强连通时,A为不可约)
  • A 为非周期的
    该过程收敛,且与初始值无关。

PageRank中涉及矩阵乘法的Power Iteration, 大矩阵可以分到多个服务器上计算,小矩阵可以快速幂

死角

图中很可能存在 dead end, 或者 trip,flow 只进不出,在这种时候需要引入一个 \(\beta\) , 使得 flow 有 \(1 - \beta\) 的概率随机出现在任何一个节点上;有 \(\beta\) 的概率正常流动。

又是想去学随机过程的一天555

posted @ 2023-02-14 20:52  爱吃番茄的玛丽亚  阅读(20)  评论(0编辑  收藏  举报