文件方式实现完整的英文词频统计实例
下载一长篇的英文小说,进行词频的分析。
1.读入待分析的字符串
2.分解提取单词
3.计数字典
4.排除语法型词汇
5.排序
6.输出TOP(20)
7.对输出结果的简要说明。
fo = open('s.txt','r') story = fo.read() fo.close() story = story.lower() for i in ',.': story =story.replace(i,' ') word = story.split(' ') exp={'','i','be','on'} dic = {} keys = set(word)-exp for a in keys: dic[a]=word.count(a) ha = list(dic.items()) ha.sort(key= lambda x:x[1],reverse=True) for i in range(20): print(ha[i])