统计文章单词出现次数
英文文章中的标点符号的处理,单词大小写的处理,再将单词通过字典的统计出现次数,最后用sorted()排序
#利用maketrans函数将标点符号映射为空格 table = str.maketrans(',.!"?:[]-',' ') #打开需要统计的文件 f = open(r'C:\python\1.txt') file1 = f.read() f.close() #根据maketrans的映射将文章中的内容进行处理,映射中的标点符号替换为空格,并且全部小写 f1 = file1.translate(table).lower() #将文章中的单词分隔开来,存在数组之中 wordlist = f1.split(None) #创建一个字典,统计每个单词出现的次数 d1 = {} for word in wordlist: d1[word] = d1.get(word,0) +1 #通过sorted函数排序,打印出前三 itemli =sorted(d1.items(), key=lambda x:x[1],reverse=True) print (itemli[0:3]) 执行结果如下: [('the', 23), ('to', 13), ('of', 11)]