大中型 UGC 平台的反垃圾(anti-spam)工作
本文来自网易云社区
随着互联网技术的日渐发展,相继诞生了垂直社区、社交平台、短视频应用、网络直播等越来越多样的产品。但在内容爆炸式增长的同时,海量UGC中也夹杂着各种违规垃圾信息,包括垃圾广告、诈骗信息、色情信息等、违法违规信息等,让不少互联网产品和广大网民深受其害。
浅谈反垃圾实现
有人会把反垃圾比喻成博弈的战场,反垃圾是一场团队战,跟灰黑产是一场成本的较量,在这场博弈中,胜利的关键依赖于高质量团队持久的协作。
反垃圾在实现方法上,其核心思想是在载体中提取数据后进行特征匹配得出分类结果的过程。例如文本反垃圾,图片反垃圾,视频反垃圾等等,文本、图片、视频都是载体。以图片为例,当人眼看到图像映射到大脑成像后获取到的信息,就完成了一次数据提取与特征匹配。同样的,反垃圾利用相同的原理提取有害信息的特征后进行机器学习,进而达到主动识别的效果。总结来说,反垃圾的技术实现在于数据提取与特征匹配。而反垃圾运营的核心就是特征的挖掘,最终实现风险与成本的平衡。
不过,随着垃圾信息越来越多样化,加上躲避拦截的方式不断升级,使得专业化的第三方智能反垃圾云服务开始成为互联网企业的新选择。日前,“网易易盾”升级了在线体验功能:进一步加强文本检测、图片检测、视频检测、语音检测等各类网络形态的反垃圾服务。点击可免费试用
相关文章:
【推荐】 限时购校验小工具&dubbo异步调用实现限
【推荐】 使用 Apache Atlas 进行数据治理
【推荐】 nej+regular环境使用es6的低成本方案