WordCount小程序及测试
Github项目地址:https://github.com/792450735/wc
PSP表格:
PSP2.1表格[1]
PSP2.1 |
PSP阶段 |
预估耗时 (分钟) |
实际耗时 (分钟) |
Planning |
计划 |
15 |
20 |
· Estimate |
· 估计这个任务需要多少时间 |
870 |
1090 |
Development |
开发 |
800 |
1040 |
· Analysis |
· 需求分析 (包括学习新技术) |
90 |
90 |
· Design Spec |
· 生成设计文档 |
30 |
30 |
· Design Review |
· 设计复审 (和同事审核设计文档) |
10 |
10 |
· Coding Standard |
· 代码规范 (为目前的开发制定合适的规范) |
10 |
10 |
· Design |
· 具体设计 |
90 |
70 |
· Coding |
· 具体编码 |
500 |
700 |
· Code Review |
· 代码复审 |
50 |
60 |
· Test |
· 测试(自我测试,修改代码,提交修改) |
50 |
60 |
Reporting |
报告 |
70 |
50 |
· Test Report |
· 测试报告 |
20 |
20 |
· Size Measurement |
· 计算工作量 |
20 |
10 |
· Postmortem & Process Improvement Plan |
· 事后总结, 并提出过程改进计划 |
30 |
20 |
|
合计 |
885 |
1110 |
解题思路:
拿到题目后,首先看大致的需求:
基本功能
wc.exe -c file.c //返回文件 file.c 的字符数
wc.exe -w file.c //返回文件 file.c 的单词总数
wc.exe -l file.c //返回文件 file.c 的总行数
wc.exe -o outputFile.txt //将结果输出到指定文件outputFile.txt
扩展功能
wc.exe -s //递归处理目录下符合条件的文件
wc.exe -a file.c //返回更复杂的数据(代码行 / 空行 / 注释行)
wc.exe -e stopList.txt // 停用词表,统计文件单词总数时,不统计该表中的单词
大致明确了要求,需要用java语言编写,需要学习:java如何对文件进行操作[2];java的基本语法;java对字符、字符串、数组等的操作[3];将程序打包成.exe文件并将配置环境打包进去[4]等。
程序设计实现过程:
首先决定把功能分为三块:计算字符数、单词数、总行数和停用词放在一块(wc());-a功能另放一块(hard());-o功能也一块(oout())。
可以把程序只用一个主类,上面三块为类里的三个方法,并且由于方法之间需要数据通信,所以将记录的数据设为public static,并且另写一个初始化函数init(),当读多个文件时,每读一个后,重新初始化数据。
代码说明:
关键代码分为三个核心方法,一个初始化方法,一个main函数。
主类里的数据申明:
public static int words=0;//单词数
public static int lines=1;//行数
public static int chars=0,t1=0,t2=0,t3=0;//t1,t2,t3分别为代码行,空行,注释行
public static ArrayList<String> fname=new ArrayList<String>();//一个或多个要读取的.c文件组。
public static String outname="result.txt";//输出文件的文件名
public static String stopList;//停用词表
main函数中:通过设一个flags数组来记录用户输入的命令,然后根据数组来确定调用哪些函数,同时也将命令按指定的顺序排列好,可以处理用户的乱序输入。
int[] flags=new int[]{0,0,0,0,0};
for(int i=0;i<args.length;i++){
if(args[i].equals("-c"))
flags[0]=1;
if(args[i].equals("-w"))
flags[1]=1;
if(args[i].equals("-l"))
flags[2]=1;
if(args[i].equals("-a"))
flags[4]=1;
if(!args[i].equals("-c")&&!args[i].equals("-w")&&!args[i].equals("-l")&&!args[i].equals("-o")&&!args[i].equals("-a")&&!args[i].equals("-e")&&!args[i].equals("-s")){
fname.add(args[i]);
}
if(args[i].equals("-o")){
outname=args[++i];
}
if(args[i].equals("-e")){
stopList=args[++i];
flags[3]=1;
}
}
函数public static void wc(String ff,int[] use)计算字符数,单词数,行数,包括停用词表。
计算字符数,单词数,行数的核心代码如下:每读一个字符,chars就加一,每读到\n,lines就加一,计算单词时则要立个flag,当读到非字符,并且非符号字符之前的字符是符号字符,则words加一。
while((c=f.read())!=-1){
chars++;
if(c=='\n'){
lines++;
chars=chars-2;
}
if(whiteSpace.indexOf(c)==-1){
newlist.append((char)c);
}
if(whiteSpace.indexOf(c)!=-1){
if(lastNotWhite){
words++;
for(int j=0;j<stopwords.size();j++){
if(newlist.toString().equals(stopwords.get(j)))
words--;
}
newlist.delete(0, newlist.length());
}
lastNotWhite=false;
lastisword=true;
}
else{
lastisword=false;
lastNotWhite=true;
}
}
if(!lastisword){
for(int j=0;j<stopwords.size();j++){
if(newlist.toString().equals(stopwords.get(j)))
words--;
}
}
如果有使用停用词表的命令,则读取停用词表指定的文件,并使用一个数组存停用词,如下:
while((c=fs.read())!=-1){
if(whiteSpace.indexOf(c)==-1){
list.append((char)c);
}
if(whiteSpace.indexOf(c)!=-1){
if(lastNotWhite){
stopwords.add(list.toString());
list.delete(0, list.length());
}
lastisword=true;
lastNotWhite=false;
}
else{
lastisword=false;
lastNotWhite=true;
}
}
if(!lastisword){
stopwords.add(list.toString());
}
lastisword=false;
lastNotWhite=false;
这样,当读到单词时,遍历停用词数组,如果匹配则words不增加:
if(whiteSpace.indexOf(c)!=-1){
if(lastNotWhite){
words++;
for(int j=0;j<stopwords.size();j++){
if(newlist.toString().equals(stopwords.get(j)))
words--;
}
newlist.delete(0, newlist.length());
}
lastNotWhite=false;
lastisword=true;
}
else{
lastisword=false;
lastNotWhite=true;
}
函数public static void oout(String f,String ff,int[] use)就是对指定文件的创建和写入,没什么特别的。
函数 public static void hard(String f)响应-a指令,要求是:
代码行:本行包括多于一个字符的代码。
空 行:本行全部是空格或格式控制字符,如果包括代码,则只有不超过一个可显示的字符,例如“{”。
注释行:本行不是代码行,并且本行包括注释。一个有趣的例子是有些程序员会在单字符后面加注释:
}//注释
在这种情况下,这一行属于注释行。
根据需求,我认为需要按行读取文件,并且立个flag,当读到第一个是字符,flag置为1,当第二个还是字符,则可以判定是代码行,当第二个是“/”,并且其后还是“/”,则判定为注释行,判定结束后,如果flag没变(仍是0),则为空行。
代码如下:
File ff=new File(f);
InputStreamReader fff=new InputStreamReader(new FileInputStream(f));
BufferedReader freader=new BufferedReader(fff);
String l=null;
int isflag=0;//isflag=10为代码行,=11为注释行,=0为空行
while((l=freader.readLine())!=null){
isflag=0;
for(int i=0;i<l.length();i++){
if(l.charAt(i)!=' '&&l.charAt(i)!='/'&&isflag==0&&l.charAt(i)!='\t')
{isflag=1;continue;}
if(l.charAt(i)!=' '&&l.charAt(i)!='/'&&isflag==1)
{isflag=10;break;}
if(l.charAt(i)=='/'&&isflag==0)
{isflag=2;continue;}
if(l.charAt(i)=='/'&&isflag==1)
{isflag=2;continue;}
if(l.charAt(i)=='/'&&isflag==2)
{isflag=11;break;}
}
if(isflag==10||isflag==1)
t1++;
else if(isflag==11)
t3++;
else
t2++;
}
System.out.println(f+",代码行/空行/注释行:"+t1+"/"+t2+"/"+t3);
}
测试设计过程:
测试需要尽可能地覆盖所有可能,WordCount程序的高风险地方在于许多不常用的,判断比较模糊的边界,比如:\n,\r,\t算不算字符,停用词表是否能被正确停用,空文件的读取,字符后面的注释算代码行还是注释行,注释后面接代码是注释行还是代码行等等。
我的测试用例如下:
1:测试-c功能
wc.exe -c test1.c
期望输出:
test1.c,字符数:21
2:测试-l功能
wc.exe -l test1.c
期望输出:
test1.c,行数:7
3:测试-w功能
wc.exe -w test1.c
期望输出:
test1.c,单词数:8
4:测试-a功能
wc.exe -a test1.c
期望输出:
test1.c,代码行/空行/注释行:4/1/2
5:测试是否能按要求顺序输出:
wc.exe -a -l -w -c test1.c
期望输出:
test1.c,字符数:21
test1.c,单词数:8
test1.c,行数:7
test1.c,代码行/空行/注释行:4/1/2
6:测试-o功能:
wc.exe -c test1.c -o output.txt
期望输出:
成功创建output.txt,里面内容为
test1.c,字符数:21
7:测试能否按要求顺序输出到指定文件:
wc.exe -a -l -w -c test1.c -o output.txt
期望输出:
output.txt中内容为:
test1.c,字符数:21
test1.c,单词数:8
test1.c,行数:7
test1.c,代码行/空行/注释行:4/1/2
8:测试-e功能:
wc.exe -w test1.c -e stop.txt
期望输出:
test1.c,单词数:6
9:测试单/多字符后接注释的判断:
wc.exe -a test2.c
期望输出:
test2.c,代码行/空行/注释行:3/1/0
10:测试空文本的输出:
wc.exe -a -l -w -c test3.c
期望输出:
test3.c,字符数:0
test3.c,单词数:0
test3.c,行数:1
test3.c,代码行/空行/注释行:0/1/0
参考文献连接:
[1]: http://www.cnblogs.com/xinz/archive/2011/10/22/2220872.html
[2]: http://www.cnblogs.com/fnlingnzb-learner/p/6010165.html
[3]: http://blog.csdn.net/Maxiao1204/article/details/52880308
[4]: http://blog.csdn.net/sunkun2013/article/details/13167099