正则表达式贪婪与非贪婪模式
之前做程序的时候看到过正则表达式的贪婪与非贪婪模式,今天用的时候就想不起来了,现在这里总结一下,以备自己以后用到注意。
1.什么是正则表达式的贪婪与非贪婪匹配
如:String str="abcaxc";
Patter p="ab.*c";
贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab.*c)。
非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab.*c)。
2.编程中如何区分两种模式
默认是贪婪模式;在量词后面直接加上一个问号?就是非贪婪模式。
量词:{m,n}:m到n个
*:任意多个
+:一个到多个
?:0或一个
3.程序实例
使用Snort的规则一条规则的一部分作为匹配文本,匹配出其中的content部分。
1 import java.util.regex.Matcher; 2 import java.util.regex.Pattern; 3 4 public class RegularTest { 5 6 public static void main(String[] arg){ 7 String text="(content:\"rcpt to root\";pcre:\"word\";)"; 8 String rule1="content:\".+\""; //贪婪模式 9 String rule2="content:\".+?\""; //非贪婪模式 10 11 System.out.println("文本:"+text); 12 System.out.println("贪婪模式:"+rule1); 13 Pattern p1 =Pattern.compile(rule1); 14 Matcher m1 = p1.matcher(text); 15 while(m1.find()){ 16 System.out.println("匹配结果:"+m1.group(0)); 17 } 18 19 System.out.println("非贪婪模式:"+rule2); 20 Pattern p2 =Pattern.compile(rule2); 21 Matcher m2 = p2.matcher(text); 22 while(m2.find()){ 23 System.out.println("匹配结果:"+m2.group(0)); 24 } 25 } 26 }
执行结果:
4.注意
在linux C 下面没有编译成功使用?号的非贪婪模式。
网上的一句话:the ? only works for Perl-based regexp, not for POSIX...