正则表达式

元数据

字符转义

\来取消这些字符的特殊意义

重复

字符类
[]制定一个字符范围

[0-9]等价于 \d

[a-z0-9A-Z_]等价于 \w（如果只考虑英文的话）

分支条件

|或，匹配分枝条件时，将会从左到右地测试每个条件，如果满足了某个分枝的话，就不会去再管其它的条件了

反义

向后引用

捕获	(exp)	匹配exp,并捕获文本到自动命名的组里
	(?<name>exp)	匹配exp,并捕获文本到名称为name的组里，也可以写成(?'name'exp)
	(?:exp)	匹配exp,不捕获匹配的文本，也不给此分组分配组号
零宽断言	(?=exp)	匹配exp前面的位置（零宽度正预测先行断言）
	(?<=exp)	匹配exp后面的位置（零宽度正回顾后发断言）
	(?!exp)	匹配后面跟的不是exp的位置（零宽度负预测先行断言）
	(?<!exp)	匹配前面不是exp的位置（零宽度负回顾后发断言）
注释	(?#comment)	这种类型的分组不对正则表达式的处理产生任何影响，用于提供注释让人阅读

\b(\w+)\b\s+\1\b可以用来匹配重复的单词，像 go go, 或者 kitty kitty等价于 \b(?<Word>\w+)\b\s+\k<Word>\

零宽度正预测先行断言，它断言自身出现的位置的后面能匹配表达式exp。比如 \b\w+(?=ing\b)，匹配以ing结尾的单词的前面部分(除了ing以外的部分)，singing的sing

零宽度正回顾后发断言，它断言自身出现的位置的前面能匹配表达式exp。比如 (?<=\bre)\w+\b，匹配以re开头的单词的后半部分(除了re以外的部分)regret的gret

零宽度负预测先行断言，断言此位置的后面不能匹配表达式exp。例如： \d{3}(?!\d)匹配三位数字，而且这三位数字的后面不能是数字

零宽度负回顾后发断言来断言此位置的前面不能匹配表达式exp。例如： (?<![a-z])\d{7}匹配前面不是小写字母的七位数字。

贪婪匹配：当正则表达式中包含能接受重复的限定符时，通常的行为是（在使整个表达式能得到匹配的前提下）匹配尽可能多的字符。a.*b（aabab）

懒惰匹配：是匹配尽可能少的字符。a.*?b（ aab，ab）

懒惰表

posted on 2014-01-07 16:35 瞌睡的美人鱼阅读(236) 评论(0) 收藏举报

刷新页面返回顶部

公告