作业4 词频统计2
- 结对对象:梁开宝 博客地址:http://www.cnblogs.com/liangkaibao/ 贡献比例 50% 50%
- 基于作业3的结果,读取一个较小的文本文件A_Tale_of_Two_Cities.txt,统计该文件中的单词的频率,并将统计结果输出到当前目录下的 Result1.txt 文件。 (第一阶段初稿完成该要求)
- 命令行格式: 提示符> Myapp.exe -f filename.txt > Result.txt (PS:C++ 程序,Java 程序输出方式类似) filename.txt 为前面下载的文件名。PS: 命令行格式的程序编写参考
- 解释:
- 选项 -f 表示后面跟文件名
- 输出格式规定(参考作业3中的示例):
- 首先按照频率由高到低排序
- 频率一样的词, 按照字典顺序排序
- 此外, 读取一个较大的文本文件Gone_with_the_wind.txt实验对比程序执行效率,做如下改进,比较改进前后程序执行时间。
- 基于作业3这次的程序多了个查找的部分,查找部分代码如下
- public static void main(String[] args){//在字符串中找ab出现的次数
-
Pattern p=Pattern.compile("ab");
String u="abcdefsfsaffsabadfewfadfgea";
Matcher m=p.matcher(u);
int i=0;
while(m.find()){
i++;
}
System.out.println(“出现次数:”+i);
} - 运行结果
- 小结:结对编程还是有很多好处的