Ted

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

2012年4月11日

摘要: 作者:阮一峰日期:2011年8月27日上一次,我介绍了贝叶斯推断的原理,今天讲如何将它用于垃圾邮件过滤。========================================贝叶斯推断及其互联网应用作者:阮一峰(接上文)七、什么是贝叶斯过滤器?垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。2002年,Paul Graha 阅读全文
posted @ 2012-04-11 00:32 wufawei 阅读(866) 评论(0) 推荐(0) 编辑

摘要: 最近看黑客与画家,里面有提到用贝叶斯算法来过滤垃圾邮件。很久之前就看过翻译者ruanyifeng在其blog上关于贝叶斯推断的文章,写得很清楚。这里转载一下。作者:阮一峰日期:2011年8月25日一年前的这个时候,我正在翻译Paul Graham的《黑客与画家》。那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件(英文版)?说实话,我没完全看懂那一章。那时,交稿截止日期已经过了,没时间留给我去啃概率论教科书了。我只好硬着头皮,按照字面意思把它译了出来。虽然交稿了,译文质量也还可以,但是心里很不舒服,下决心一定要搞懂它。一年过去了,我读了一些 阅读全文
posted @ 2012-04-11 00:28 wufawei 阅读(975) 评论(0) 推荐(0) 编辑