会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
HongNa
博客园
首页
新随笔
联系
订阅
管理
2019年3月18日
中文统计
摘要: 中文词频统计 1. 下载一长篇中文小说。 2. 从文件读取待分析文本。 3. 安装并使用jieba进行中文分词。 ljieba.lcut(text) 4. 更新词库,加入所分析对象的专业词汇。 #词库文本文件 5. 生成词频统计 6. 排序 7. 排除语法型词汇,代词、冠词、连词 8. 输出词频最大
阅读全文
posted @ 2019-03-18 11:40 HongNa
阅读(285)
评论(0)
推荐(0)
编辑
公告