201671010424马玉琴实验二词频统计软件项目

一、需求分析
1.设计一个词频统计小软件,对给定的英文文章进行单词频率的统计。
2.文章中相应的标点不计入统计。
3.将统计结果以从大到小的排序方式输出。
二、功能设计
1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
2.程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
3.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数。
4.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
5.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
三、设计实现
1.读入哈利波特这个文档
2.用户输入想要查找的一个或者人一个英文单词,可出现该词在文中出现的频数
3.程序具有统计功能,可以按照文本中词频数降序显示词频以及单词
4.程序可以输出到文件中。
四、源代码地址:https://github.com/styleab/demo
五、测试运行


六、实验总结
因为是跨专业之前没有学习过计算机编程,独立完成这个作业很困难,而且这次时间很短只能完成老师布置的部分内容。老师把作业布置下来我从网上找了一些参考示例和资料,经过比较作业完成时间较短,在作业规定胡提交时间很难全部学会,而且没有编程基础,只能捉摸着写出一点点的代码,以及向同学请教完成一部分。以后要利用空闲时间学习编程。
七、PSP

posted @ 2019-03-20 09:02  style-  阅读(227)  评论(2编辑  收藏  举报