摘要:
作者:阮一峰日期:2011年8月27日上一次,我介绍了贝叶斯推断的原理,今天讲如何将它用于垃圾邮件过滤。========================================贝叶斯推断及其互联网应用作者:阮一峰(接上文)七、什么是贝叶斯过滤器?垃圾邮件是一种令人头痛的顽症,困扰着所有的互联网用户。正确识别垃圾邮件的技术难度非常大。传统的垃圾邮件过滤方法,主要有"关键词法"和"校验码法"等。前者的过滤依据是特定的词语;后者则是计算邮件文本的校验码,再与已知的垃圾邮件进行对比。它们的识别效果都不理想,而且很容易规避。2002年,Paul Graha 阅读全文
摘要:
最近看黑客与画家,里面有提到用贝叶斯算法来过滤垃圾邮件。很久之前就看过翻译者ruanyifeng在其blog上关于贝叶斯推断的文章,写得很清楚。这里转载一下。作者:阮一峰日期:2011年8月25日一年前的这个时候,我正在翻译Paul Graham的《黑客与画家》。那本书大部分谈的是技术哲学,但是第八章却写了一个非常具体的技术问题----如何使用贝叶斯推断过滤垃圾邮件(英文版)?说实话,我没完全看懂那一章。那时,交稿截止日期已经过了,没时间留给我去啃概率论教科书了。我只好硬着头皮,按照字面意思把它译了出来。虽然交稿了,译文质量也还可以,但是心里很不舒服,下决心一定要搞懂它。一年过去了,我读了一些 阅读全文