201671030108 +词频统计软件项目报告

任务一：

需求分析

使用JAVA编程语言，独立完成一个英文文本词频统计的软件开发。软件基本功能要求如下：
1.程序可读入任意英文文本文件，该文件中英文词数大于等于1个。
2.程序需要很壮健，能读取容纳英文原版《哈利波特》10万词以上的文章。
3.指定单词词频统计功能：用户可输入从该文本中想要查找词频的一个或任意多个英文单词，运行程序的统计功能可显示对应单词在文本中出现的次数和柱状图。
4.高频词统计功能：用户从键盘输入高频词输出的个数k，运行程序统计功能，可按文本中词频数降序显示前k个单词的词频及单词。
5.统计该文本所有单词数量及词频数，并能将单词及词频数按字典顺序输出到文件result.txt 。
根据实验要求得出如下功能需求：
1.指定单词词频统计功能
2.高频词统计功能
3.统计该文本所有单词数量及词频数

功能设计

根据实验要求分为基本功能和扩展功能如下：
1.基本功能（3项）：指定单词词频统计功能、高频词统计功能、统计该文本所有单词数量及词频数按字典顺序输出的功能同时生成result.txt文件。
2.扩展功能（1项）：将词频数降序排列的功能。

设计实现

设计了主类Main.java，接口类CountDao.java，接口实现类Count.java。
主类功能是显示功能选项，进行功能接口调用；接口类功能是调用接口实现类即调用具体功能；接口实现类主要用来编写具体实现功能。
设计实现流程图如下：

测试运行

本次设计一共实现了4项功能，测试结果如下图所示：

优秀代码展示

统计文本文件中的单词个数

   //通过键值对的方式去分别存储单词和出现的次数
   //Map<String, Integer> map = new TreeMap<String, Integer>();
   //创建一个words数组，将split分割的字符串存入数组
   String[] words = s.split("[【】、.。,\"!--;:?\'\\] ]");
   for (int i = 0; i < words.length; i++) {
   	String key = words[i].toLowerCase();//将所有单词转化为小写
       if (key.length() > 0) {
       	//用containsKey判断map集合对象中是否包含某个字符串
           if (!map.containsKey(key)) {//如果不包括说明第一次出现,则给频率值赋1;
           	map.put(key, 1);
           	} else {// 如果不是第一次出现，就把value值++，那么value值是多少就是出现了几次
           		int value = map.get(key);//用get(key)获取对应的value值
           		value++;
           		map.put(key, value);
           		}
           }
       }

按照指定单词查询出现次数

System.out.print("请输入想查询的单词：");
        Scanner scan1 = new Scanner(System.in);
        String word = scan1.nextLine();
        //判断是否存在所要查询的单词
        boolean b = map.containsKey(word);
        if(b){
        	//根据key单词查找次数value
        	for (Map.Entry<String, Integer> m :map.entrySet())  {

        		if (m.getKey().equals(word)) {
        		int v = m.getValue();
        		System.out.println(v);
        		}}
        }else {
			System.out.println("此单词不存在！");
		}

value按照降序排列输出map

//按照value降序排列map
         List<Map.Entry<String, Integer>> nlist = new LinkedList<Map.Entry<String, Integer>>(map.entrySet());
         Collections.sort(nlist, new Comparator<Map.Entry<String, Integer>>()
         {
             @Override
             public int compare(Map.Entry<String, Integer> o1, Map.Entry<String, Integer> o2)
             {
                 int compare = (o1.getValue()).compareTo(o2.getValue());
                 return -compare;
             }
         });

         Map<String, Integer> result = new LinkedHashMap<String, Integer>();
         for (Map.Entry<String, Integer> entry : nlist) {
             result.put(entry.getKey(), entry.getValue());
         }
         
         for (String a : result.keySet()) {
         	System.out.println( a + "-----" + result.get(a));
         	}

对key按照字典顺序输出map

//利用TreeMap实现Comparator接口
        Comparator<Map.Entry<String, Integer>> valueComparator = new Comparator<Map.Entry<String,Integer>>() {
        	public int compare(Map.Entry<String, Integer> o1,Map.Entry<String, Integer> o2) { 
        		return o1.getKey().compareTo(o2.getKey());//降序排序
       		}
        }; 
        //map转换成list进行排序，Entry是Map中的一个静态内部类，用来表示Map中的每个键值对
        //map.EntrySet(),实现了Set接口，里面存放的是键值对.
        List<Map.Entry<String, Integer>> list = new ArrayList<Map.Entry<String,Integer>>(map.entrySet()); 
        // 排序
        Collections.sort(list,valueComparator); 
        System.out.println("已生成result.txt文件");
        System.out.println("-----------------所有单词按字典顺序排序如下---------------");
      	for (Map.Entry<String, Integer> entry : list) { 
      		System.out.println(entry.getKey() + "----" + entry.getValue());
       		bufferedWriter.write(entry.getKey()+"----"+entry.getValue()+"\r\n");
       		}

总结

   在设计的过程中主要遵循“低耦合高内聚”的模块化原则，本人在实验中设计一个Main主类的基础上通过接口调用接口实现类来实现其他各个功能，以达到实验要求同时便于分而治之的编写需要实现的4个功能。

任务二：

将包含任务1源码的完整工程文件提交到已注册的Github账号下的项目仓库中
我的本次设计代码你可以在源码完整查看

任务三：

本次设计的PSP

总结

   这次设计在刚刚开始的设计部分花了很多的时间，主要是不知道从哪儿下手，而且自己的编程功底也不是很好，所以在完成此次设计的时候花费了很多的时间，也找了很多的资料来进一步了解JAVA语言的使用。但是这次设计也没有很完整，没有实现柱状图的功能，对于不熟悉和未实现的功能我会在以后的学习中更加努力的补回来。

posted @ 2019-03-20 08:55 娓娓一叶舟阅读(685) 评论(3) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

娓娓一叶舟

201671030108 +词频统计软件项目报告

任务一：

需求分析

功能设计

设计实现

测试运行

优秀代码展示

总结

任务二：

任务三：

本次设计的PSP

总结

公告