代码改变世界

java 正则 块转义,忽略大小写,匹配换行模式,匹配先前匹配的文本(解释正则运行机制)

2012-07-20 17:14  java线程例子  阅读(2448)  评论(0编辑  收藏  举报

@author YHC

            //块转义:\Q \E \Q会抑制所有的元字符的含义  
	    //,如果漏写了\E,那么从\Q开始之后的所有字符都将当作字面文本对待  
	    System.out.println("*'".matches("\\Q*'\\E"));//true  
	    //全部忽略大小写   
	    System.out.println("ABc".matches("(?i)abc"));//true  
	    //仅此a忽略大小写,(?i)会在正则表达式剩余打开  
	    //,不区分大小写,(?-i)会关闭剩余部分的匹配,他们就像一对开关  
	    System.out.println("ABc".matches("(?i)a(?-i)bc"));//false  
	       //.代表任意字符,如果字符串中有\r\n,将不能匹配,所以我们需要开启  
	    //匹配换行模式 对比  
	    System.out.println("5455433535\r\n523543".matches(".*"));//false  
	    //开启换行匹配,javascript不支持  
	    System.out.println("5455433535\r\n523543".matches("(?s).*"));//true  
	    //再次匹配先前匹配的文本,下面的08出现了三次,那么我们如何匹配这样的文本  
	    //例如一个正则表达式也可以完成这样的功能2009-09-09 同样匹配  
	    //为了在一个正则表达式中匹配先前匹配到的文本,我们首先必须捕获上次  
	    //匹配的文本,这可以使用捕获分组实现,我们可以使用反向引用,在该正则  
	    //表达式的任何地方匹配相同文本,你可以使用反斜杠后根一个单个数字(1-9)  
	    //来引用前九个分组,,而第10-99组需要用\10~-99  
	    //注意:不能使用 \01 因为在java中这个是一个8进制的转义字符  
	    System.out.println("2008-08-08".matches("\\d\\d(\\d\\d)-\\1-\\1"));//true  
	    System.out.println("2009-09-09".matches("\\d\\d(\\d\\d)-\\1-\\1"));//true 
	    
	    //对以上的解释运行机制
	    //当正则表达式\\d\\d(\\d\\d)-\\1-\\1遇到2008-08-08的时候
	    //第一个\\d\\d会匹配20接着根据目标文本中达到的位置,正则引擎会引进
	    //分组,在捕获分组中的(\\d\\d)会匹配08,然后引擎会到达分组的右括号
	    //在这个点上,部分匹配08会保存到1号捕获分组中,下一个几号是连字符,它
	    //会按照字面进行匹配,接着就遇到反像引用,正则引擎会检查第一个捕获分组
	    //的内容:08,然后引擎会试着按照字面来匹配这个文本,如果该正则表达式
	    //是不区分大小写的,那么捕获分组也会按照这种方式进行匹配,在这里如果
	    //反向引用会匹配成功.下一个连字符和反向引用也会匹配成功这样就找到了
	    //一整个匹配:2008-08-08
	    
	    //注意:捕获分组的重复匹配
	    //一个对改组的反向引用只会匹配该分组的最后一次捕获到的文本;
	    //example 重复匹配
	    //如果同一个正则表达式遇到2008-05-28 2002-02-02,当\\d\\d(\\d\\d)
	    //匹配到2008的时候,该分组第一次捕获到的内容:08,会被保存到一个
	    //(也是唯一一个)捕获分组中,接下来,连字符:-也会匹配它自身,
	    //反向引用在试图用05匹配08的时候,匹配会失败.
	    //由于该正则表达式中不存在其他的分支,引擎也会放弃匹配尝试,
	    //从目标文本中的第一个0开始\\1不再存有任何文本内容,也就是
	    //反向引用\\1,没有内容了
	    //接下来继续处理2008-05-28 2002-02-02,该分组下一次会,
	    //捕获到的内容是当\\d\\d(\\d\\d)匹配到2002的时候,它会
	    //将02保存起来,接下来连字符匹配自身,现在反向引用试图匹配02,
	    //这次匹配是成功的,接着下一个连字符,反向引用,都会匹配成功,
	    //结果是找到了2002-02-02
	    
	    //注意:正则引擎的顺序
	    //因为正则是从前向后处理的,因此应当把捕获括号放到反向引用的前面,
	    //正则表达式\\d\\d\\1-(\\d\\d)-\\1,\\d\\d\\1-\\1-(\\d\\d)
	    //永远不可能匹配到任何东西,因为这里的反向引用是在捕获分组之前的
	    //因此它没有捕获到任何东西.