平衡组/递归匹配

(?'group')把捕获的内容命名为group并压入堆栈

(?'-group')从堆栈上弹出最后压入堆栈的名为group的内容,如果堆栈本来为空,则本分组的匹配失败

(?(group)yes|no) 如果堆栈上存在以名为 group 的捕获内容的话,继续匹配 yes 部分的表达式,否则继续匹配 no部分

(?!) 零宽负向先行断言,由于没有后缀表达式,试图匹配总是失败

<                         #最外层的左括号 
    [^<>]*                #最外层的左括号后面不是括号的内容 
    ( 
        ( 
            (?'Open'<)    #碰到了左括号,在堆栈中写入一个"Open" 
            [^<>]*        #匹配左括号后面的不是括号的内容 
        )+ 
        ( 
            (?'-Open'>)   #碰到了右括号,弹出一个"Open" 
            [^<>]*        #匹配右括号后面不是括号的内容 
        )+ 
    )* 
    (?(Open)(?!))         #在遇到最外层的右括号前面,判断堆栈上还有没有没弹出的"Open";如果还有,则匹配失败 
>                         #最外层的右括号 

平衡组的一个最常见的应用就是匹配HTML,下面这个例子可以匹配嵌套的<div>标签:
    <div[^>]*>[^<>]*(((?'Open'<div[^>]*>)[^<>]*)+((?'-Open'</div>)[^<>]*)+)*(?(Open)(?!))</div
>

posted @ 2012-11-22 11:18  WenEric  阅读(614)  评论(0编辑  收藏  举报