摘要: kNN 文本分类K-means 文本聚类1.预处理标签处理分词标注 ictclas-linux32-jni去停用词2.倒排索引,词频统计3.特征选择信息增益 http://www.blogjava.net/zhenandaci/archive/2009/03/24/261701.html卡方统计 http://hi.baidu.com/bjwyl66/item/4b578612bc934e572a3e22d04.分类器svm knn 5.性能评价正确率召回率F1测度 阅读全文
posted @ 2014-01-15 10:24 夏树 阅读(249) 评论(0) 推荐(0) 编辑