摘要: 文本分类的定义 文本分类是现在非常热门的一个研究领域,也是机器学习中最为重要最为基础的组成部分。文本分类有各种各样的方法,有些简单易懂,有些看上去非常复杂。其实只要搞清楚他们背后的原理,理解文本分类并不是一件很困难的事情。今天先从宏观上介绍一下文本分类,后续会在其他博文中分门别类对文本分类这一课题进行深入的分析,敬请关注。也希望各位高手们多提建议,毕竟我也是菜鸟一个。 文本分类就是将一篇文章归入已有的几个类别当中,这里注重强调2点: 1 要分类的类别必须是事先确定的,并且短时间内不会发生改变。 2 分类的类别并不一定唯一。 文本分类的方法 1 人工制订规则 这种方法最大的弊端... 阅读全文
posted @ 2012-02-14 09:27 ~大器晚成~ 阅读(9398) 评论(7) 推荐(3) 编辑