摘要: 在前一篇文本分类基础之上,由于在文本分类过程中 需要分开测试集训练集,因此采用weka为过滤器配置的批量过滤BatchFiltering,网上资料很少,因此经过实验可以实现,对训练集 测试集分开。测试集按照训练集的特征进行下面的运算: 1.训练集和测试集生成向量空间java weka.core.co 阅读全文
posted @ 2016-12-11 20:31 百变小超 阅读(828) 评论(1) 推荐(0) 编辑
摘要: 0.注意weka的中文编码RunWeka.ini 》fileEncoding=utf-81.首先对分词后的 无新词发现的分词文件,转换成arff文件 命令java weka.core.converters.TextDirectoryLoader -dir D:\weibo\catagory\data 阅读全文
posted @ 2016-12-11 20:19 百变小超 阅读(563) 评论(0) 推荐(0) 编辑