2018年3月8日

文本处理之Python词频统计

摘要: 往前2篇的博客中,爬取了谣言百科网站中不同分类的新闻并以文本的形式存取下来啦。 上一篇博客中对存取的文件进行了中文分词操作,现在我们想要对存取的文本进行词频统计操作。 上代码: 运行完词频统计结束~ 阅读全文

posted @ 2018-03-08 15:05 baorant 阅读(636) 评论(0) 推荐(0) 编辑

文本分词处理Python实践

摘要: 上一篇博客中爬取到了10个类别中数据并以文本的形式存取。 第二步便考虑对获得的文本进行分词操作~ 开发环境: anaconda3; jieba分词;(在anaconda中pip install jieba 命令成功下载并安装jieba包(conda和pip是两个不同的包管理器,那个jieba没在co 阅读全文

posted @ 2018-03-08 12:38 baorant 阅读(1776) 评论(0) 推荐(0) 编辑

导航