TrustRank

TrustRank是combat web spam中最经典的方法之一,其他文章都与其进行比较。该方法基于的假设是:好的叶面很少指向spam页面。具体做法是选择一些好的页面(good seeds),在初始向量中d,这些好的种子页面置1,其余置0。最后再对d进行一下规一化处理。然后利用该d计算偏向性的PageRank值,即为TrustRank值。该值越高说明该页面越值得信赖,是spam的概率越低。

posted on 2010-01-29 08:37  小橋流水  阅读(240)  评论(0编辑  收藏  举报

导航