一、课程名称:2016级计算机科学与工程学院软件工程(西北师范大学)

二、课程要求:实验二 软件工程个人项目

三、实验目标:

(1)掌握软件项目个人开发流程。
(2)掌握Github上发布软件项目的操作方法。

四、实验内容:

(一)需求分析

  1. 程序可读入任意英文文本文件,改文件中英文词数大于等于1个,且能读取容纳英文原版《哈利波特》10万词以上的文章。
  2. 指定单词词频统计功能:用户可输入从该文本中想要查找词频的一个或任意多个英文单词,运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
  3. 高频词统计功能:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
  4. 统计该文本所有单词数量及词频数,并能将单词及词频数按字典顺序输出到文件result.txt。

(二)功能设计

  1. 文件的读入输出功能:针对需求一和需求四。
  2. 键盘输入功能:针对需求二和需求三(用户可从键盘输入查看词频统计个数的的展示)。
  3. 频词统计功能:针对需求二、三、四(运用程序的统计功能进行词频统计)。
  4. 排序功能:针对需求三和需求四(按照词频数降序,按照字典顺序排序)。

(三)设计实现

  1. 该程序共有四个类,包括一个主函数Main.java和三个功能类。主函数Main.java用来控制整个流程(读入文本、单词词频统计、柱状图展示)
  2. WordCount.java:指定单词词频统计,可显示对应单词在文本中出现的次数和柱状图。
  3. HighCount.java:用户从键盘输入高频词输出的个数k,运行程序统计功能,可按文本中词频数降序显示前k个单词的词频及单词。
  4. WordSave.java:统计文本所有单词数量及词频数,并将单词及词频数按字典顺序输出到文件result.txt。

(四)测试运行

  1. 功能1测试
  2. 功能2测试
  3. 功能3测试
  4. 功能4测试

(五)代码展示

  1. 读入文本,并将文本内容按照正则表达式截取纯单词文本(即不包含其他字符)
```//读入《哈利波特》 String line = "src/word.txt"; File file = new File(line); InputStreamReader is = new InputStreamReader(new FileInputStream(file), "utf-8"); BufferedReader buff = new BufferedReader(is); List list = new ArrayList();//list中只存放纯单词文本 String readLine = null;//单词列表初始为空 while((readLine = buff.readLine())!=null){ String[] WordsArr = readLine.split("[^a-zA-z]"); for(String word:WordsArr){ if(word.length()!=0){ list.add(word);//将截取后的纯单词放入list } } } buff.close(); ```
  1. 本段代码实现了最后一个功能:将单词及词频数按字典顺序输出到文件result.txt
```//按字典顺序输出到文件result.txt File file = new File("src/result.txt"); if(file.exists()) { file.createNewFile(); } FileWriter fop = new FileWriter(file.getAbsoluteFile()); for(Entry entry : Map2.entrySet()) { fop.write(entry.getKey()+":\t"+entry.getValue()+"\n"); } fop.close(); System.out.println("存放成功!"); ```

(六)总结

在程序设计过程中,需求分析必不可少。如果一开始就写代码,能写一两个功能,但是要完整地实现整个程序并运行,必须对每个功能模块进行分析。该程序中,涉及到了文本的读入和输出、单词个数的统计以及排序功能,各个功能模块之间虽然都有联系,但最好保证各模块之间的独立性,便于程序的测试和维护。

(七)PSP

PSP2.1任务内容计划共完成需要的时间(min)实际完成需要的时间(min)
Planning计划88
Estimate估计这个任务需要多少时间,并规划大致工作步骤1010
Development开发200230
Analysis需求分析 (包括学习新技术)1515
Design Spec生成设计文档1012
Design Review设计复审 (和同事审核设计文档)24
Coding Standard代码规范 (为目前的开发制定合适的规范)88
Design具体设计1520
Coding具体编码150220
Code Review代码复审1010
Test测试(自我测试,修改代码,提交修改)1515
Reporting报告2020
Test Report测试报告55
Size Measurement计算工作量55
Postmortem & Process Improvement Plan事后总结 ,并提出过程改进计划58

(八)经验分享

编写程序不是单纯的写代码,在正式写代码之前,设计显得尤为重要。而且在设计功能模块时不能将所有功能放在一起,要做到功能模块独立性,模块独立是优秀设计的关键,而设计又是决定软件质量的关键环节。其次,要学会正确的查阅资料。

点此查看项目源代码