摘要: 本章概要本章主要介绍了两种分类技术:朴素贝叶斯分类(Naive Bayesian Classification)费舍尔分类器(Fisher Classification)上面两种技术的共性都是基于条件概率计算不同分类的概率,然后通过设定一些阀值,找到最适合的分类。分类过程中,都使用了权重概率,用户避免极概率的发生。当然,上述两种分类器不仅仅局对邮件分类,还可以对其他实物,如文章,图像,商品等分类,关键是如何抽取特性。特性特性是根据不同实物而变化的。比如一般的文本,如新闻。可以将词语出现与否作为特性。比如邮件,可以将发送邮件的IP,发送者,发送时间,大写出现频率等均作为特性。训练人工将一系列特性 阅读全文
posted @ 2012-11-15 21:15 bourneli 阅读(604) 评论(0) 推荐(0) 编辑