会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
没有神保佑的瓶子
博客园
首页
新随笔
联系
订阅
管理
2018年9月11日
数据挖掘——文本挖掘-绘制词云
摘要: 文本挖掘是将文本信息转化为可利用的数据的知识。 一、创建“语料库” 语料库(Corpus)是我们要分析的所有文档的集合。 将现有的文本文档的内容添加到一个新的语料库中。 实现逻辑: 将各文本文件分类放置在一个根目录下,通过遍历读取根目录下所有子目录中的所有文件, 然后将读取结果赋值到一个数据框中,得
阅读全文
posted @ 2018-09-11 23:00 没有神保佑的瓶子
阅读(1328)
评论(0)
推荐(0)
编辑
公告