摘要: 第一步:语料转化为词袋向量 step 1. 声明一个向量化工具vectorizer; 本文使用的是CountVectorizer,默认情况下,CountVectorizer仅统计长度超过两个字符的词,但是在短文本中任何一个字都可能十分重要,比如“去/到”等,所以要想让CountVectorizer也 阅读全文
posted @ 2018-07-20 22:44 迷茫的计算机呆 阅读(545) 评论(0) 推荐(0) 编辑