作业 4:词频统计——基本功能

一、基本信息

结对成员: 胡子翔 1613072059

      张鑫     1613072057

二、项目分析

Task1 基本任务

实现一个控制台程序,在给定一个英文字符串文件,统计其中各个英文单词出现的频率。

1.程序运行模块(方法、函数)介绍:

(1)统计文件中的有效行数

1 def process_line(dst): #统计行数
2     count = 0
3     for line in open(dst, 'r').readlines():
4         if line != '' and line != '\n':
5             count += 1
6     return count

(2)统计文件中各单词出现的次数,输出频率最高的十个。

1 output_result(word_freq, f)  # 输出单词前10
2     print('双词组前十词组:', file=f)
3     output_result(Phrase_freq2, f)  # 输出双词组前10
4     print('三词组前十词组:', file=f)
5     output_result(Phrase_freq3, f)  # 输出双词组前10

 

(3)将结果输出到文件result.txt。

1 def output_result(word_freq, f):   # 输出结果
2     if word_freq:
3         sorted_word_freq = sorted(word_freq.items(), key=lambda v: v[1], reverse=True)
4         for item in sorted_word_freq[:10]:  # 输出 Top 10 的单词
5             print(item[0], ':', item[1], file=f)

 

2.程序运行案例截图

Task2:查看常用的短语 

三、性能分析

四、其他

整个过程从讨论到编程完成大约用去一周时间。

 

五、分析与总结

这次合作完成的作业锻炼了我们两人相互协作的能力,前期的讨论和意见交换也起到了很好的效果。集合两个人的想法着实提高了不少效率,过程中也出现了一些小问题,但好在我们意见统一的非常快,也为后面工作的进行奠定了基础。我们在这样一次结对编程的过程中体验到合作的重要性,这是一个很棒学习的过程。

 

posted @ 2018-10-21 18:58  胡子翔  阅读(215)  评论(1编辑  收藏  举报