一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。

仅简单统计英文。

from collections import Counter
f = open('1')
c = Counter()
for line in f:
        g = (x for x in line.split())
        c.update(Counter(g))
f.close()
print sorted(dict(c).items(), key = lambda x : x[1], reverse = True)

运行结果。

[('cd', 5), ('xy', 2), ('ab', 2)]

  

posted on 2015-08-30 11:13  sudo987  阅读(341)  评论(0编辑  收藏  举报

导航