摘要: 中文文本分类不像英文文本分类一样只需要将单词一个个分开就可以了,中文文本分类需要将文字组成的词语分出来构成一个个向量。所以,需要分词。 这里使用网上流行的开源分词工具结巴分词(jieba),它可以有效的将句子里的词语一个个的提取出来,关于结巴分词的原理此处不再赘述,关键是他的使用方法。1、安装 结巴 阅读全文
posted @ 2017-07-10 10:25 乡间小路 阅读(4771) 评论(1) 推荐(3) 编辑