java 正则 块转义,忽略大小写,匹配换行模式,匹配先前匹配的文本(解释正则运行机制)
2012-07-20 17:14 java线程例子 阅读(2448) 评论(0) 编辑 收藏 举报@author YHC
//块转义:\Q \E \Q会抑制所有的元字符的含义 //,如果漏写了\E,那么从\Q开始之后的所有字符都将当作字面文本对待 System.out.println("*'".matches("\\Q*'\\E"));//true //全部忽略大小写 System.out.println("ABc".matches("(?i)abc"));//true //仅此a忽略大小写,(?i)会在正则表达式剩余打开 //,不区分大小写,(?-i)会关闭剩余部分的匹配,他们就像一对开关 System.out.println("ABc".matches("(?i)a(?-i)bc"));//false //.代表任意字符,如果字符串中有\r\n,将不能匹配,所以我们需要开启 //匹配换行模式 对比 System.out.println("5455433535\r\n523543".matches(".*"));//false //开启换行匹配,javascript不支持 System.out.println("5455433535\r\n523543".matches("(?s).*"));//true //再次匹配先前匹配的文本,下面的08出现了三次,那么我们如何匹配这样的文本 //例如一个正则表达式也可以完成这样的功能2009-09-09 同样匹配 //为了在一个正则表达式中匹配先前匹配到的文本,我们首先必须捕获上次 //匹配的文本,这可以使用捕获分组实现,我们可以使用反向引用,在该正则 //表达式的任何地方匹配相同文本,你可以使用反斜杠后根一个单个数字(1-9) //来引用前九个分组,,而第10-99组需要用\10~-99 //注意:不能使用 \01 因为在java中这个是一个8进制的转义字符 System.out.println("2008-08-08".matches("\\d\\d(\\d\\d)-\\1-\\1"));//true System.out.println("2009-09-09".matches("\\d\\d(\\d\\d)-\\1-\\1"));//true //对以上的解释运行机制 //当正则表达式\\d\\d(\\d\\d)-\\1-\\1遇到2008-08-08的时候 //第一个\\d\\d会匹配20接着根据目标文本中达到的位置,正则引擎会引进 //分组,在捕获分组中的(\\d\\d)会匹配08,然后引擎会到达分组的右括号 //在这个点上,部分匹配08会保存到1号捕获分组中,下一个几号是连字符,它 //会按照字面进行匹配,接着就遇到反像引用,正则引擎会检查第一个捕获分组 //的内容:08,然后引擎会试着按照字面来匹配这个文本,如果该正则表达式 //是不区分大小写的,那么捕获分组也会按照这种方式进行匹配,在这里如果 //反向引用会匹配成功.下一个连字符和反向引用也会匹配成功这样就找到了 //一整个匹配:2008-08-08 //注意:捕获分组的重复匹配 //一个对改组的反向引用只会匹配该分组的最后一次捕获到的文本; //example 重复匹配 //如果同一个正则表达式遇到2008-05-28 2002-02-02,当\\d\\d(\\d\\d) //匹配到2008的时候,该分组第一次捕获到的内容:08,会被保存到一个 //(也是唯一一个)捕获分组中,接下来,连字符:-也会匹配它自身, //反向引用在试图用05匹配08的时候,匹配会失败. //由于该正则表达式中不存在其他的分支,引擎也会放弃匹配尝试, //从目标文本中的第一个0开始\\1不再存有任何文本内容,也就是 //反向引用\\1,没有内容了 //接下来继续处理2008-05-28 2002-02-02,该分组下一次会, //捕获到的内容是当\\d\\d(\\d\\d)匹配到2002的时候,它会 //将02保存起来,接下来连字符匹配自身,现在反向引用试图匹配02, //这次匹配是成功的,接着下一个连字符,反向引用,都会匹配成功, //结果是找到了2002-02-02 //注意:正则引擎的顺序 //因为正则是从前向后处理的,因此应当把捕获括号放到反向引用的前面, //正则表达式\\d\\d\\1-(\\d\\d)-\\1,\\d\\d\\1-\\1-(\\d\\d) //永远不可能匹配到任何东西,因为这里的反向引用是在捕获分组之前的 //因此它没有捕获到任何东西.