摘要: 下载一中文长篇小说,并转换成UTF-8编码;使用jieba库,进行中文词频统计,输出TOP20的词及出现次数;排除一些无意义词、合并同一词。 import jieba txt=open('test.txt','r',encoding='utf-8').read() words=list(jieba. 阅读全文
posted @ 2017-09-29 09:50 047连薇娜 阅读(124) 评论(0) 推荐(0) 编辑