统计文章单词出现次数

英文文章中的标点符号的处理，单词大小写的处理，再将单词通过字典的统计出现次数，最后用sorted()排序

#利用maketrans函数将标点符号映射为空格
table = str.maketrans(',.!"?:[]-',' ')
#打开需要统计的文件
f = open(r'C:\python\1.txt')
file1 = f.read()
f.close()
#根据maketrans的映射将文章中的内容进行处理，映射中的标点符号替换为空格，并且全部小写
f1 = file1.translate(table).lower()
#将文章中的单词分隔开来，存在数组之中
wordlist = f1.split(None)
#创建一个字典,统计每个单词出现的次数
d1 = {}
for word in wordlist:
d1[word] = d1.get(word,0) +1
#通过sorted函数排序，打印出前三
itemli =sorted(d1.items(), key=lambda x:x[1],reverse=True)
print (itemli[0:3])

执行结果如下：
[('the', 23), ('to', 13), ('of', 11)]

posted @ 2019-02-18 16:10 小学弟- 阅读(506) 评论(0) 编辑收藏举报

刷新页面返回顶部

统计文章单词出现次数

公告