会员
周边
捐助
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
711
博客园
首页
新随笔
联系
订阅
管理
2018年10月19日
完整的中英文词频统计
摘要: 步骤: 1.准备utf-8编码的文本文件file 2.通过文件读取字符串 str 3.对文本进行预处理 4.分解提取单词 list 5.单词计数字典 set , dict 6.按词频排序 list.sort(key=) 7.排除语法型词汇,代词、冠词、连词等无语义词 8.输出TOP(20) 一、.英
阅读全文
posted @ 2018-10-19 21:14 张震34
阅读(239)
评论(0)
推荐(0)
编辑
公告