正则表达式 总结

介绍
1.        基本的语法字符
      \d  0-9
的数字

\D  \d的补集(以所以字符为全集,下同),即所有非数字的字符
\w 
单词字符,指大小写字母、0-9的数字、下划线
\W  \w
的补集
\s 
空白字符,包括换行符\n、回车符\r、制表符\t、垂直制表符\v、换页符\f
\S  \s
的补集
除换行符\n外的任意字符
[…] 
匹配[]内所列出的所有字符
[^…] 
匹配非[]内所列出的字符

2.         定位字符
定位字符所代表的是一个虚的字符,它代表一个位置,你也可以直观地认为定位字符所代表的是某个字符与字符间的那个微小间隙。
表示其后的字符必须位于字符串的开始处
表示其前面的字符必须位于字符串的结束处
\b 
匹配一个单词的边界
\B 
匹配一个非单词的边界
另外,还包括:\A  前面的字符必须位于字符处的开始处,\z  前面的字符必须位于字符串的结束处,\Z  前面的字符必须位于字符串的结束处,或者位于换行符前

3.         重复描述字符
重复描述字符是体现C#正则表达式很好很强大的地方之一:
{n} 
匹配前面的字符n
{n,} 
匹配前面的字符n次或多于n
{n,m} 
匹配前面的字符nm
匹配前面的字符01
匹配前面的字符1次或多于1
匹配前面的字符0次或式于0

4.         择一匹配
C#
正则表达式中的 (|) 符号似乎没有一个专门的称谓,姑且称之为择一匹配吧。事实上,像[a-z]也是一种择一匹配,只不过它只能匹配单个字符,而(|)则提供了更大的范围,(ab|xy)表示匹配ab或匹配xy。注意“|”“()”在此是一个整体

应用

正则式

说明

^\d+$

非负整数(正整数 + 0

^[0-9]*[1-9][0-9]*$

正整数

^((-\d+)|(0+))$

非正整数(负整数 + 0

^-[0-9]*[1-9][0-9]*$

负整数

^-?\d+$

整数

^\d+(\.\d+)?$

非负浮点数(正浮点数 + 0

^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$

正浮点数

^((-\d+(\.\d+)?)|(0+(\.0+)?))$

非正浮点数(负浮点数 + 0

^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$

负浮点数

^(-?\d+)(\.\d+)?$

浮点数

^[A-Za-z]+$

26个英文字母组成的字符串

^[A-Z]+$

26个英文字母的大写组成的字符串

^[a-z]+$

26个英文字母的小写组成的字符串

^[A-Za-z0-9]+$

由数字和26个英文字母组成的字符串

^\w+$

由数字、26个英文字母或者下划线组成的字符串

^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$

email地址

^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$

url

^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$

--

^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$

//

^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$

Emil

(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)?

电话号码

^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$

IP地址




posted @ 2009-08-28 13:37  TSPWATER'S HOME  阅读(160)  评论(0编辑  收藏  举报