201671030121 王天悦 词频统计软件项目报告
一 需求分析:
做一个词频统计程序,该程序具有以下功能:
(1)可倒入任意英文文本文件
(2)统计该英文文件中单词数和各单词出现的频率(次数),并能将单词按字典顺序输出。
(3)可能的话可否将单词及频率写入数据库(文件)
二 基本功能需求:
1.使用文件操作。
2.将英文文章先读到一个字符串中。
3.将英文文章中的单词分离时,主要使用strtok函数。
4.将英文单词排序时使用strcmp函数。
三 测试运行:
四 部分代码展示:
public static StringBuffer getFile () { //文件读入函数
String str=null;//定义一个字符串类型变量str
StringBuffer sb1= new StringBuffer();
try {//try代码块,当发生异常时会转到catch代码块中
//读取指定的文件
BufferedReader in = new BufferedReader(new FileReader("1.txt"));
while ((str = in.readLine())!= null) {//readLine()方法, 用于读取一行,只要读取内容不为空就一直执行
sb1.append(str);
}
in.close();
} catch (IOException e) {//当try代码块有异常时转到catch代码块
System.out.println("读取有误");
e.printStackTrace();//printStackTrace()方法是打印异常信息在程序中出错的位置及原因
}
System.out.println(sb1);//输出sb1
return sb1;
}
六 总 结:
在这次实验中遇到了很多困难,有些问题到现在仍然没有解决,以后需要努力学习。
实验源代码:https://github.com/wty123456/wangtianyue
七 PSP:
任务内容 | 计划共完成需要的时间 | 实际完成需要的时间 |
计划 | 10 | 5 |
需求分析 (包括学习新技术、新工具的时间) | 10 | 10 |
生成设计文档 (整体框架的设计,各模块的接口,用时序图,快速原型等方法) | 20 | 18 |
设计复审 | 8 | 8 |
代码规范 (为目前的开发制定或选择合适的规范) | 5 | 3 |
具体设计(用伪代码,流程图等方法来设计具体模块) | 5 | 3 |
具体编码 | 30 | 40 |
代码复审 | 10 | 10 |
测试(自我测试,修改代码,提交修改) | 20 | 30 |
测试报告(发现了多少bug,修复了多少) |
10 | 10 |
计算工作量 (多少行代码,多少次签入,多少测试用例,其他工作量) |
15 | 13 |
事后总结, 并提出改进计划 (包括写文档、博客的时间) |
20 | 15 |