会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
没有神保佑的瓶子
博客园
首页
新随笔
联系
订阅
管理
2018年9月25日
数据挖掘——关键字提取—sklearn的实际应用
摘要: 前面的步骤都相似 #构建语料库 #使用jieba包进行分词,并将分词结果用空格分隔后再传回分词列表 #导入sklearn包中计算TF-IDF的模块,可以将停用词以参数的形式传入CountVectorizer模块 得到numpy类的数据结构,需要进行转换 #将得到的TF-IDF结构转换成数组的形式,并
阅读全文
posted @ 2018-09-25 23:47 没有神保佑的瓶子
阅读(903)
评论(0)
推荐(0)
编辑
公告