会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
没有神保佑的瓶子
博客园
首页
新随笔
联系
订阅
管理
2018年9月22日
数据挖掘——文本挖掘-关键字提取
摘要: 基于jieba包的自动提取 关键方法:jieba.analyse.extract_tags(content,topK=n) 具体思路:通过jieba包自带的extract_tags方法,在遍历读取文件内容时,获得每篇文档前n个关键字 使用的包: 过程: 最终得到包含文件路径,文件内容,和每篇5个关键
阅读全文
posted @ 2018-09-22 16:00 没有神保佑的瓶子
阅读(2492)
评论(0)
推荐(0)
编辑
公告