摘要: 构建一个垃圾邮件分类器 ​ 对于垃圾邮件,我们可以人为的挑选若干个关键词作为识别垃圾邮件判断的特征,而在实际应用中,我们应该遍历整个训练集,在训练集中找出出现次数最多的n个单词,n介于10,000和50,000之间,将这些单词作为所选用的特征。根据所找到的特征集合,我们可以为每一个邮件构建一个向量, 阅读全文
posted @ 2017-07-06 23:25 SrtFrmGNU 阅读(1783) 评论(2) 推荐(0) 编辑