正则表达式贪婪与非贪婪模式

之前做程序的时候看到过正则表达式的贪婪与非贪婪模式,今天用的时候就想不起来了,现在这里总结一下,以备自己以后用到注意。

1.什么是正则表达式的贪婪与非贪婪匹配

  如:String str="abcaxc";

    Patter p="ab.*c";

  贪婪匹配:正则表达式一般趋向于最大长度匹配,也就是所谓的贪婪匹配。如上面使用模式p匹配字符串str,结果就是匹配到:abcaxc(ab.*c)。

  非贪婪匹配:就是匹配到结果就好,就少的匹配字符。如上面使用模式p匹配字符串str,结果就是匹配到:abc(ab.*c)。

2.编程中如何区分两种模式

  默认是贪婪模式;在量词后面直接加上一个问号?就是非贪婪模式。

  量词:{m,n}:m到n个

     *:任意多个

     +:一个到多个

     ?:0或一个

3.程序实例

使用Snort的规则一条规则的一部分作为匹配文本,匹配出其中的content部分。

 1 import java.util.regex.Matcher;
 2 import java.util.regex.Pattern;
 3 
 4 public class RegularTest {
 5     
 6     public static void main(String[] arg){
 7         String text="(content:\"rcpt to root\";pcre:\"word\";)";
 8         String rule1="content:\".+\"";    //贪婪模式
 9         String rule2="content:\".+?\"";    //非贪婪模式
10         
11         System.out.println("文本:"+text);
12         System.out.println("贪婪模式:"+rule1);
13         Pattern p1 =Pattern.compile(rule1);
14         Matcher m1 = p1.matcher(text);
15         while(m1.find()){
16             System.out.println("匹配结果:"+m1.group(0));
17         }
18         
19         System.out.println("非贪婪模式:"+rule2);
20         Pattern p2 =Pattern.compile(rule2);
21         Matcher m2 = p2.matcher(text);
22         while(m2.find()){
23             System.out.println("匹配结果:"+m2.group(0));
24         }
25     }
26 }

执行结果:

 4.注意

  在linux C 下面没有编译成功使用?号的非贪婪模式。

   网上的一句话:the ? only works for Perl-based regexp, not for POSIX...

posted on 2014-03-08 11:28  旭东的博客  阅读(160298)  评论(7编辑  收藏  举报

导航