作业要求 20180918-1 词频统计

作业要求参见 https://edu.cnblogs.com/campus/nenu/2018fall/homework/2126

本次作业代码地址: https://coding.net/u/Zy19951122/p/wf/git/tree/origin

1.定义文件名和计数变量

file_name='C://wf_python//gongneng1.txt'
total=0

2. 打开指定文章并对其进行遍历

  open函数打开gongneng1的文本,对读取的文本文档逐行进行遍历,将文本逐行存在line中  

  重点:通过split()函数将单词与符号分隔开,计算每个词的个数

file=open(file_name,"r")
for line in file.readlines():
    w = line.split(' ')

    total=total + len(w)

print ("total ",total)
print('\n')

3.计算总的单词数

  重点:通过python自带模块的counter函数对总单词数进行统计。

counter = collections.Counter(patt.findall(
    open(file_name,'rt').read()
    ))

 

功能1 小文件输入

 

 

 

 

功能2 支持命令行输入英文作品的文件名

 难点:

1.开始如何用C语言编写一个可以有命令行参数的程序是我起步的第一个困难,我在上面也花费了很多的时间,但是没还是没弄懂,所以选择了python。

2.python有很多模块都是编译好的,但是需要去网上查,和具体的程序,只有这样才能做出程序。

3.每天都很开心的准备去做作业,但是发现想做的无从下手,没有教程,只能问身边的朋友,希望以后自己会努力有所提高,获取那些能获得的知识。

此项目的PSP表格

差异原因:对自己编程能力高估,本科很多知识点都没有学到,花了大量的时间进行查阅资料,还是无法实现这些功能,以后会继续加强努力的,

阶段 估计时间(单位:分钟) 实际时间(单位:分钟) 差异时间(单位:分钟)
功能1 303 603 +300
功能2 215 248 +33
功能3 -- -- --
功能4 -- -- --
测试功能 100 94 -6
词频统计项目 618 945 327
posted @ 2018-09-24 17:36  张宇-计算机技术  阅读(175)  评论(0编辑  收藏  举报