摘要:
在前一篇文本分类基础之上,由于在文本分类过程中 需要分开测试集训练集,因此采用weka为过滤器配置的批量过滤BatchFiltering,网上资料很少,因此经过实验可以实现,对训练集 测试集分开。测试集按照训练集的特征进行下面的运算: 1.训练集和测试集生成向量空间java weka.core.co 阅读全文
摘要:
0.注意weka的中文编码RunWeka.ini 》fileEncoding=utf-81.首先对分词后的 无新词发现的分词文件,转换成arff文件 命令java weka.core.converters.TextDirectoryLoader -dir D:\weibo\catagory\data 阅读全文