2018 年 9月 11 日随笔档案 - 没有神保佑的瓶子

2018年9月11日

摘要：文本挖掘是将文本信息转化为可利用的数据的知识。一、创建“语料库” 语料库（Corpus）是我们要分析的所有文档的集合。将现有的文本文档的内容添加到一个新的语料库中。实现逻辑：将各文本文件分类放置在一个根目录下，通过遍历读取根目录下所有子目录中的所有文件，然后将读取结果赋值到一个数据框中，得阅读全文

posted @ 2018-09-11 23:00 没有神保佑的瓶子阅读(1328) 评论(0) 推荐(0) 编辑

没有神保佑的瓶子

公告