统计文章单词出现次数

英文文章中的标点符号的处理,单词大小写的处理,再将单词通过字典的统计出现次数,最后用sorted()排序

#利用maketrans函数将标点符号映射为空格
table = str.maketrans(',.!"?:[]-',' ')
#打开需要统计的文件
f = open(r'C:\python\1.txt')
file1 = f.read()
f.close()
#根据maketrans的映射将文章中的内容进行处理,映射中的标点符号替换为空格,并且全部小写
f1 = file1.translate(table).lower()
#将文章中的单词分隔开来,存在数组之中
wordlist = f1.split(None)
#创建一个字典,统计每个单词出现的次数
d1 = {}
for word in wordlist:
d1[word] = d1.get(word,0) +1
#通过sorted函数排序,打印出前三
itemli =sorted(d1.items(), key=lambda x:x[1],reverse=True)
print (itemli[0:3])

执行结果如下:
[('the', 23), ('to', 13), ('of', 11)]

 

posted @ 2019-02-18 16:10  小学弟-  阅读(506)  评论(0编辑  收藏  举报