作业要求 20180918-1 词频统计
作业要求参见 https://edu.cnblogs.com/campus/nenu/2018fall/homework/2126
本次作业代码地址: https://coding.net/u/Zy19951122/p/wf/git/tree/origin
1.定义文件名和计数变量
file_name='C://wf_python//gongneng1.txt' total=0
2. 打开指定文章并对其进行遍历
open函数打开gongneng1的文本,对读取的文本文档逐行进行遍历,将文本逐行存在line中
重点:通过split()函数将单词与符号分隔开,计算每个词的个数
file=open(file_name,"r") for line in file.readlines(): w = line.split(' ') total=total + len(w) print ("total ",total) print('\n')
3.计算总的单词数
重点:通过python自带模块的counter函数对总单词数进行统计。
counter = collections.Counter(patt.findall( open(file_name,'rt').read() ))
功能1 小文件输入
功能2 支持命令行输入英文作品的文件名
难点:
1.开始如何用C语言编写一个可以有命令行参数的程序是我起步的第一个困难,我在上面也花费了很多的时间,但是没还是没弄懂,所以选择了python。
2.python有很多模块都是编译好的,但是需要去网上查,和具体的程序,只有这样才能做出程序。
3.每天都很开心的准备去做作业,但是发现想做的无从下手,没有教程,只能问身边的朋友,希望以后自己会努力有所提高,获取那些能获得的知识。
此项目的PSP表格
差异原因:对自己编程能力高估,本科很多知识点都没有学到,花了大量的时间进行查阅资料,还是无法实现这些功能,以后会继续加强努力的,
阶段 | 估计时间(单位:分钟) | 实际时间(单位:分钟) | 差异时间(单位:分钟) |
功能1 | 303 | 603 | +300 |
功能2 | 215 | 248 | +33 |
功能3 | -- | -- | -- |
功能4 | -- | -- | -- |
测试功能 | 100 | 94 | -6 |
词频统计项目 | 618 | 945 | 327 |