BadRank
BadRank是通过spam种子来发现更多的spam页面的一种方法。该方法基于的假设是:指向spam页面的页面通常也是spam页面(TrustRank假设的逆否)。将WEB的所有链接反向,得到反向的WEB图。人工选择一些spam页面种子,在pagerank中的初始向量d中,这些种子对应的分量置1,其余为0。然后对d做一下规一化处理。最后在反向图上,利用该d跑偏向性的pagerank算法,得到的pagerank值即为BadRank值,该值越高说明是spam的机率越大。
本文基于署名 2.5 中国大陆许可协议发布,欢迎转载,演绎或用于商业目的,但是必须保留本文的署名小橋流水(包含链接)。如您有任何疑问或者授权方面的协商,请给我发邮件。