摘要: 前面的步骤都相似 #构建语料库 #使用jieba包进行分词,并将分词结果用空格分隔后再传回分词列表 #导入sklearn包中计算TF-IDF的模块,可以将停用词以参数的形式传入CountVectorizer模块 得到numpy类的数据结构,需要进行转换 #将得到的TF-IDF结构转换成数组的形式,并 阅读全文
posted @ 2018-09-25 23:47 没有神保佑的瓶子 阅读(903) 评论(0) 推荐(0) 编辑