摘要: 待处理的数据为放在两个文件夹中的各25个txt文本,文本信息为电子邮件内容,文件夹spam中的25个邮件都是正常邮件;ham中的25个邮件是垃圾邮件; 利用朴素贝叶斯算法,训练分类器,采取交叉验证的方式,结果证明,分类器能够很好的识别垃圾邮件; 代码主要参考【机器学习实战】,但是有的代码已经不能用了 阅读全文
posted @ 2016-11-02 20:42 coskaka 阅读(2415) 评论(0) 推荐(0) 编辑