Regular Expression

http://www.cnblogs.com/deerchao/archive/2006/08/24/zhengzhe30fengzhongjiaocheng.html

metacharacter(元字符)

  \b  单词的开头或结尾,也就是单词的分界处

  \d  一位数字

  \w  字母或数字或下划线或汉字

  \s  任意的空白符,包括空格,制表符(Tab),换行符,中文全角空格等

  .  匹配除换行符以外的任意字符

  ^  字符串开始

  $   字符串结束

转义

    unibetter\.com匹配unibetter.com

    C:\\Windows匹配C:\Windows

    \( 匹配(

范围

  [aeiou]  匹配任何一个英文元音字母

  [.?!]    匹配标点符号(.或?或!)

  [0-9]    \d

  [a-z0-9A-Z_]  \w

重复

  *  它代表的不是字符,也不是位置,而是数量。任意数量。可能是0次

  +  一个或多个

  ?  零次或者1次

  {n}  重复n次

  {n,}  重复n次或更多次

  {n,m}  重复n到m次

  例子

    \ba\w*\b  匹配以字母a开头的单词——先是某个单词开始处(\b),然后是字母a,然后是任意数量的字母或数字(\w*),最后是单词结束处(\b)

    \bhi\b.*\bLucy\b  先是一个单词hi,然后是任意个任意字符(但不能是换行),最后是Lucy这个单词

    0\d\d-\d\d\d\d\d\d\d\d=0\d{2}-\d{8}

    Windows\d+匹配Windows后面跟1个或更多数字

    ^\d{5,12}$ QQ号必须为5位到12位数字

    \(?0\d{2}[) -]?\d{8} 这个表达式可以匹配几种格式的电话号码,像(010)88886666,或022-22334455,或02912345678等。我们对它进行一些分析吧:首先是一个转义字符\(,它能出现0次或1次(?),然后是一个0,后面跟着2个数字(\d{2}),然后是)-空格中的一个,它出现1次或不出现(?),最后是8个数字(\d{8})

    

分支条件

  指的是有几种规则,如果满足其中任意一种规则都应该当成匹配,具体方法是用|把不同的规则分隔开

  0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)

 

分组

  ((2[0-4]\d|25[0-5]|[01]?\d\d?)\.){3}(2[0-4]\d|25[0-5]|[01]?\d\d?)

反义

  \W  匹配任意不是字母,数字,下划线,汉字的字符

  \S  匹配任意不是空白符的字符

  \D  匹配任意非数字的字符

  \B  匹配不是单词开头或结束的位置

  [^x]  匹配除了x以外的任意字符

  [^aeiou]  匹配除了aeiou这几个字母以外的任意字符

  <a[^>]+>匹配用尖括号括起来的以a开头的字符串

posted @ 2013-12-26 11:11  jinxinhelloworld  阅读(142)  评论(0编辑  收藏  举报