郭自轻

作业4 词频统计2

  • 结对对象:梁开宝  博客地址:http://www.cnblogs.com/liangkaibao/  贡献比例 50% 50%
  • 基于作业3的结果,读取一个较小的文本文件A_Tale_of_Two_Cities.txt,统计该文件中的单词的频率,并将统计结果输出到当前目录下的 Result1.txt 文件。 (第一阶段初稿完成该要求)
  • 命令行格式: 提示符> Myapp.exe -f filename.txt > Result.txt (PS:C++ 程序,Java 程序输出方式类似) filename.txt 为前面下载的文件名。PS: 命令行格式的程序编写参考
  • 解释:
    • 选项 -f 表示后面跟文件名
    • 输出格式规定(参考作业3中的示例):
      • 首先按照频率由高到低排序
      • 频率一样的词, 按照字典顺序排序
  • 此外, 读取一个较大的文本文件Gone_with_the_wind.txt实验对比程序执行效率,做如下改进,比较改进前后程序执行时间。
  • 基于作业3这次的程序多了个查找的部分,查找部分代码如下
  • public static void main(String[] args){//在字符串中找ab出现的次数
  •   Pattern p=Pattern.compile("ab");
    String u="abcdefsfsaffsabadfewfadfgea";
    Matcher m=p.matcher(u);
    int i=0;
    while(m.find()){
    i++;
    }
    System.out.println(“出现次数:”+i);
    }
  • 运行结果
  • 小结:结对编程还是有很多好处的

posted on 2016-03-29 16:44  郭自轻  阅读(149)  评论(2编辑  收藏  举报

导航