2018 年 9月 25 日随笔档案 - 没有神保佑的瓶子

2018年9月25日

摘要：前面的步骤都相似 #构建语料库 #使用jieba包进行分词，并将分词结果用空格分隔后再传回分词列表 #导入sklearn包中计算TF-IDF的模块，可以将停用词以参数的形式传入CountVectorizer模块得到numpy类的数据结构，需要进行转换 #将得到的TF-IDF结构转换成数组的形式，并阅读全文

posted @ 2018-09-25 23:47 没有神保佑的瓶子阅读(903) 评论(0) 推荐(0) 编辑

没有神保佑的瓶子

公告