摘要: 文本挖掘是将文本信息转化为可利用的数据的知识。 一、创建“语料库” 语料库(Corpus)是我们要分析的所有文档的集合。 将现有的文本文档的内容添加到一个新的语料库中。 实现逻辑: 将各文本文件分类放置在一个根目录下,通过遍历读取根目录下所有子目录中的所有文件, 然后将读取结果赋值到一个数据框中,得 阅读全文
posted @ 2018-09-11 23:00 没有神保佑的瓶子 阅读(1328) 评论(0) 推荐(0) 编辑