搜索引擎的反作弊问题
1.反作弊的道和术问题:
术:根据看到的作弊的例子,去分析它,然后清除它
道:透过具体的作弊例子,找到作弊的动机和本质,从本质上解决问题
2.通信模型在反作弊中的应用:
通信解决噪音:
i.从信息源出发,加强通信(编码)自身的抗干扰能力
ii.从传输来看,过滤掉噪音,还原信息
搜索反作弊:
i.增强排序算法的抗噪音能力
ii.还原真实的排名
3.具体的术:
针对商业相关的搜索,采用一套“抗干扰”强的搜索算法,高噪音无法干扰
对于信息类的搜索,采用“敏感”的算法,排名比重降低
对于大量出链的网站,其余弦几乎为1
4.道:
去除网页排名信号中的噪音