文件方式实现完整的英文词频统计实例 可以下载一长篇的英文小说,进行词频的分析。 1.读入待分析的字符串 2.分解提取单词 3.计数字典 4.排除语法型词汇 5.排序 6.输出TOP(20) 7.对输出结果的简要说明。


可以下载一长篇的英文小说,进行词频的分析。

1.读入待分析的字符串

2.分解提取单词 

3.计数字典

4.排除语法型词汇

5.排序

6.输出TOP(20)

7.对输出结果的简要说明。

fo=open('11.txt','r')
s=fo.read()
fo.close()

s =s.lower()
for i in ',!?':
    s=s.replace(i,' ') 
b=s.split(' ')
qc={'','','to','is', 'and','on','for','the','as','or','has','of','are','from','-' ,'say'}

dic={}
key=set(b)-qc
for w in key:
    dic[w]=b.count(w)

wcl=list(dic.items())
wcl.sort(key=lambda x:x[1],reverse=True)

for i in range(20):
    print(wcl[i])

这是一篇关于月亮制造者的励志小说

posted on 2017-09-27 16:07  lishanting  阅读(763)  评论(0编辑  收藏  举报