(改进)Python语言实现词频统计

需求:

1.设计一个词频统计的程序。

2.英语文章中包含的英语标点符号不计入统计。

3.将统计结果按照单词的出现频率由大到小进行排序。

 

设计:

1.基本功能和用法会在程序中进行提示。

2.原理是利用分隔符分词存入列表,然后从列表读出存入字典,键为词,值存放词的数量。

 

代码如图所示:

1.导入程序所需模块。

2.定义readfile类,实现去除文章中标点符号的功能。

3.定义一个getstr类,对结果输出格式进行定义。

4.构造程序主函数。

 

测试用例:

测试用例我选择了马丁.路德.金的演讲稿。

 

部分测试结果如图所示:

 

我也看了杨老师对其他同学提出的要求,例如试着跑一跑《战争与和平》这本英语书籍,可能是由于字码数过大,没有运行处结果。

以上是我的程序的展示,不足之处请老师给予批注,谢谢老师。

posted @ 2016-11-14 11:06  CS-YYN  阅读(12161)  评论(1编辑  收藏  举报