201671010431+词频统计软件项目报告
一、需求分析
按照《构建之法》第2章中2.3所述PSP流程,使用JAVA编程语言,独立完成一个英文文本词频统计的软件开发。软件基本功能要求如下:
1.程序可读入任意英文文本文件,该文件中英文词数大于等于1个。
2.程序需要很壮健,能读取容纳英文原版《哈利波特》10万词以上的文章。
3.指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
4.高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
5.统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。
二、功能设计
1.从磁盘中读取英文文本,对文本进行处理。
2.统计单词的个数。
3.按个数降序排序。
三、设计实现
1.通过for语句进行词频统计
2.通过java语言进行编译
3.运用主函数main来实现读入文本文件,统计单词出现次数。
四、测试运行
五、PSP
六、项目总结
本次项目运用java语言编写,对于java语言的掌握还不精通,需要平时多学习基础知识,多练习编写代码。开发过程十分艰难,通过这次的项目,更能激发自己对java的学习兴趣,以及对软件工程的深刻理解。
GitHub仓库主页链接:https://github.com/tanglu007/lu