正则表达式提取String子串

最近遇到了一个字符串处理的功能,忽然发现了正则表达式的强大,深深的被她的迷人魅力所吸引,以前只是听说,今天亲眼所见,亲身经历,真的彻底折服。
言归正传:java中String类里面封装了很多字符串处理的方法,替换、查找、包含等,但是我今天遇到了一个功能竟然没有封装,就是查找出字符串内所有匹配正则表达式的字符串数组,(源字符串“2012-08-12 水电费 2012-12 abcde 2012-08-23”,正则表达式:“\\d{4}[ /-]{1}\\d{2}([ /-]{1}\\d{2})?”,我所需要的就是{“2012-08-12”,“2012-12”,“2012-08-23”}),这该怎么实现呢?
为了实现我的目的,我也煞费周折啊。认真研究了Pattern和Matcher两个类,幸好是,要不然我也就体会不到这种柳暗花明的感觉了,也感受不到正则的魅力了。其实String自身携带的方法已够应付绝大多数的应用了,Pattern中的方法基本在String中都有体现,即单独使用Pattern的时候相对就少了一点,Matcher也就使用了find() 和group()就可以实现我上面提出的功能了。

具体实现:

		String str="2012-08-12 2012-12 abcde 2012-08-23 ";
		String regex = "\\d{4}[ /-]{1}\\d{2}([ /-]{1}\\d{2})?"; //正则表达式
		Pattern pattern = Pattern.compile(regex); 
		Matcher m = pattern.matcher(str);
		List<String> matchRegexList = new ArrayList<String>();
		while(m.find()){
			matchRegexList.add(m.group());
		}

下面是整个字符串通过正则表达式进行拆分后(包含拆分符,String.split()返回的不包含正则表达式的值,要不然我也不用费那么大劲了)的数组:

		String str="2012-08-12 2012-12 abcde 2012-08-23 ";
		String regex = "\\d{4}[ /-]{1}\\d{2}([ /-]{1}\\d{2})?"; //正则表达式
		Pattern pattern = Pattern.compile(regex); 
		Matcher m = pattern.matcher(str);
		List<String> matchRegexList = new ArrayList<String>();
		while(m.find()){
			matchRegexList.add(m.group());
		}
		System.out.println(m.groupCount());
		String[] result = pattern.split(str); //使用正则表达式,分割字符串
		List<String> allSplitList = new ArrayList<String>();
		int len = matchRegexList.size() > result.length ? matchRegexList.size():result.length;
		for(int i=0; i<len; i++){
			if(i<result.length){
				allSplitList.add(result[i]);
			}
			if(i<matchRegexList.size()){
				allSplitList.add(matchRegexList.get(i));
			}
		}
		for (int i = 0; i < allSplitList.size(); i++) { //获取源字符串中匹配正则表达的字符串
			System.out.println("-"+allSplitList.get(i)+"-");
		}


posted @ 2013-08-14 12:39  skyding  阅读(22215)  评论(0编辑  收藏  举报