摘要: 最近的工作主要围绕文本分类,当前的解决方案是用R语言清洗数据,用tm包生成bag of words,用libsvm与liblinear训练模型。这个方案可以hold住6/70万的训练集: LIBLINEAR is efficient for large-scale document classifi 阅读全文
posted @ 2016-05-03 19:21 Logos 阅读(69) 评论(0) 推荐(0) 编辑