Search Engine + Recommendation System
PageRank
- 该网络的 邻接矩阵 通过变换可以变成 概率转移 矩阵
设该转移矩阵为M,最终每个节点的重要性向量为r,则有了一个状态转移方程\(M \cdot r = r\),(虽然严格意义上,应该写作 \(M \cdot r^{n} = r^{n+1}\),即一个标准的Markov过程) - 在随机过程中可以证明,马尔可夫概率转移矩阵的最大特征值为1, 每个节点的最终重要性向量就是 特征值为1对应的特征向量。
收敛性证明:(其实就是Markov过程收敛的条件)
设Markov过程为 \(P_{n+1} = A P_{n}\)
- A 为随机矩阵(A矩阵所有元素大于等于0, 并且每一列的元素和都为1)
- A 为不可约的(当图是强连通时,A为不可约)
- A 为非周期的
该过程收敛,且与初始值无关。
PageRank中涉及矩阵乘法的Power Iteration, 大矩阵可以分到多个服务器上计算,小矩阵可以快速幂
死角
图中很可能存在 dead end, 或者 trip,flow 只进不出,在这种时候需要引入一个 \(\beta\) , 使得 flow 有 \(1 - \beta\) 的概率随机出现在任何一个节点上;有 \(\beta\) 的概率正常流动。
又是想去学随机过程的一天555