2011年12月3日
摘要: 最近需要做一些和垃圾短信过滤相关的研究工作,因此有幸开始接触文本分类,在本篇文章中将对文本分类的一些工作做一些简单的介绍,有一些想法和理解可能不会很成熟,请大家谅解和指出。文本分类的目的是将某个文本进行归类,假设我们有多个文本类c1,c2,...,cn。文本分类的目的是,给定了一个文本t,我们要判别文本t属于c1,c2,..,cn中的那一类。文本通常是指一段文字,可能是一个短信,一封邮件,一个Hml文件。比如,有短信"中天花园即将盛大开盘,单价8000元/平方米,前50名订购者将优惠5000元,欢迎致电13915222354咨询"(记为t),我们设定了文本类{非垃圾短信(c 阅读全文
posted @ 2011-12-03 20:08 寂寞清风 阅读(779) 评论(0) 推荐(0) 编辑