java代码文件的统计

	    	Pattern annotationLinePattern = Pattern.compile("^\\s*(//)+");//位于代码行后面的双斜杠无法匹配
                Pattern annotationLinePattern1 = Pattern.compile("/\\*+");
	  	Pattern annotationLinePattern2 = Pattern.compile("\\*+/\\s*$");
	  	// 空白行匹配
	 	Pattern blankLinePattern = Pattern.compile("^\\s*$");	
	 	// 单词匹配
	 	Pattern wordsPattern = Pattern.compile("\\w+");

上面是正则,都比较简单。。。。我见小伙伴的代码都是用各种切割匹配,好比trim()。。。印象中之前学java时候做过实验,类似于(int)这样的类型强制转换的关键词是找不到的。。。这里也是有问题的,在注释的正则匹配那里,第二第三结合判断能够除去println里面打印字符串出现段落注释的情况,但是位于代码行后面的//匹配不了……

只能说,正则这个东西很神奇。。。。现在能够完整统计的,编译器吧……


                if (annotationLinePattern.matcher(line).find() ) {
	 		annotationLine++;
	 	}//匹配

inputWords是一个list

		Matcher ma = wordsPattern.matcher(line);
		while (ma.find()) {
			inputWords.add(ma.group());
		}这是单词匹配


双数组或者数组和list混合用的代码占用时间差不多,除非把其中一个换成map。对于大量数据时候很管用,map能节省大量时间。


posted @ 2013-11-06 22:25  Fresher_Z  阅读(140)  评论(0编辑  收藏  举报