元字符:正则表达式规定的一个特殊代码
\b:单词的开头或是结尾
\d:数字
*:同样是元字符,不过它代表的不是字符,也不是
位置,而是数量——它指定*前边的内容可以连续重
复使用任意次以使整个表达式得到匹配
.*:连在一起就意味着任意数量的不包含换行的字符
^:字符串的开始
$:字符串的结束
\s:任意的空白字符
*    重复零次或更多次
+     重复一次或更多次
?     重复零次或一次
{n}     重复n次
{n,}     重复n次或更多次
{n,m}     重复n到m次

常用的反义代码   
\W     匹配任意不是字母,数字,下划线,汉字的字符
\S     匹配任意不是空白符的字符
\D     匹配任意非数字的字符
\B     匹配不是单词开头或结束的位置
[^x]     匹配除了x以外的任意字符
[^aeiou]     匹配除了aeiou这几个字母以外的任意字符
[.\n]+        换行
\\u005C      反斜杠转义

(123)?        将字符123分组>>字符123重复0次或1次
(exp)         匹配exp,并捕获文本到自动命名的组里 (\b([\w]+)\b[\s]+)\1
(?<name>exp)     匹配exp,并捕获文本到名称为name的组里,也可以写成(?'name'exp) (\b(?<name1>[\w]+)\b[\s]+)\k<name1>
(?:exp)     匹配exp,不捕获匹配的文本,也不给此分组分配组号,举例:(?:kitty)等价于kitty
(?=exp)     匹配exp前面的位置 \b[\w]+(?=ing\b) 使用时注意(?=...)后面出现的将匹配错误,要写括号内
(?<=exp)     匹配exp后面的位置
(?!exp)     匹配后面跟的不是exp的位置
(?<!exp)     匹配前面不是exp的位置

posted on 2011-09-22 17:12  rolends1986  阅读(242)  评论(0编辑  收藏  举报