博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

聊斋志异

Posted on 2023-12-28 20:11  啊沫  阅读(8)  评论(0编辑  收藏  举报
import jieba
txt=open('聊斋志异.txt',encoding='gb18030',errors = 'ignore')
words=jieba.lcut(txt.read())
counts={}
for word in words:
    if len (word)==1:
        continue
    else:
        counts[word]=counts.get(word,0)+1
item=list(counts.items())
item.sort(key=lambda x:x[1],reverse=True)
for i in range(20):
   print("{0:<10}{1:>5}".format(item[i][0],item[i][1]))