Regular Expression
http://www.cnblogs.com/deerchao/archive/2006/08/24/zhengzhe30fengzhongjiaocheng.html
metacharacter(元字符)
\b 单词的开头或结尾,也就是单词的分界处
\d 一位数字
\w 字母或数字或下划线或汉字
\s 任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等
. 匹配除换行符以外的任意字符
^ 字符串开始
$ 字符串结束
转义
unibetter\.com匹配unibetter.com
C:\\Windows匹配C:\Windows。
\( 匹配(
范围
[aeiou] 匹配任何一个英文元音字母
[.?!] 匹配标点符号(.或?或!)
[0-9] \d
[a-z0-9A-Z_] \w
重复
* 它代表的不是字符,也不是位置,而是数量。任意数量。可能是0次
+ 一个或多个
? 零次或者1次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
例子
\ba\w*\b 匹配以字母a开头的单词——先是某个单词开始处(\b),然后是字母a,然后是任意数量的字母或数字(\w*),最后是单词结束处(\b)
\bhi\b.*\bLucy\b 先是一个单词hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词
0\d\d-\d\d\d\d\d\d\d\d=0\d{2}-\d{8}
Windows\d+匹配Windows后面跟1个或更多数字
^\d{5,12}$ QQ号必须为5位到12位数字
\(?0\d{2}[) -]?\d{8} 这个表达式可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。我们对它进行一些分析吧:首先是一个转义字符\(,它能出现0次或1次(?),然后是一个0,后面跟着2个数字(\d{2}),然后是)或-或空格中的一个,它出现1次或不出现(?),最后是8个数字(\d{8})
分支条件
指的是有几种规则,如果满足其中任意一种规则都应该当成匹配,具体方法是用|把不同的规则分隔开
0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)
分组
((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)
反义
\W 匹配任意不是字母,数字,下划线,汉字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符
<a[^>]+>匹配用尖括号括起来的以a开头的字符串