一个简单的程序,统计文本文档中的单词和汉字数,逆序排列(出现频率高的排在最前面)。python实现。
仅简单统计英文。
from collections import Counter f = open('1') c = Counter() for line in f: g = (x for x in line.split()) c.update(Counter(g)) f.close() print sorted(dict(c).items(), key = lambda x : x[1], reverse = True)
运行结果。
[('cd', 5), ('xy', 2), ('ab', 2)]