正则表达式 总结
介绍
1. 基本的语法字符
\d 0-9的数字
\D \d的补集(以所以字符为全集,下同),即所有非数字的字符
\w 单词字符,指大小写字母、0-9的数字、下划线
\W \w的补集
\s 空白字符,包括换行符\n、回车符\r、制表符\t、垂直制表符\v、换页符\f
\S \s的补集
. 除换行符\n外的任意字符
[…] 匹配[]内所列出的所有字符
[^…] 匹配非[]内所列出的字符
2. 定位字符
“定位字符”所代表的是一个虚的字符,它代表一个位置,你也可以直观地认为“定位字符”所代表的是某个字符与字符间的那个微小间隙。
^ 表示其后的字符必须位于字符串的开始处
$ 表示其前面的字符必须位于字符串的结束处
\b 匹配一个单词的边界
\B 匹配一个非单词的边界
另外,还包括:\A 前面的字符必须位于字符处的开始处,\z 前面的字符必须位于字符串的结束处,\Z 前面的字符必须位于字符串的结束处,或者位于换行符前
3. 重复描述字符
“重复描述字符”是体现C#正则表达式“很好很强大”的地方之一:
{n} 匹配前面的字符n次
{n,} 匹配前面的字符n次或多于n次
{n,m} 匹配前面的字符n到m次
? 匹配前面的字符0或1次
+ 匹配前面的字符1次或多于1次
* 匹配前面的字符0次或式于0次
4. 择一匹配
C#正则表达式中的 (|) 符号似乎没有一个专门的称谓,姑且称之为“择一匹配”吧。事实上,像[a-z]也是一种择一匹配,只不过它只能匹配单个字符,而(|)则提供了更大的范围,(ab|xy)表示匹配ab或匹配xy。注意“|”与“()”在此是一个整体
应用
正则式 |
说明 |
^\d+$ |
非负整数(正整数 + 0) |
^[0-9]*[1-9][0-9]*$ |
正整数 |
^((-\d+)|(0+))$ |
非正整数(负整数 + 0) |
^-[0-9]*[1-9][0-9]*$ |
负整数 |
^-?\d+$ |
整数 |
^\d+(\.\d+)?$ |
非负浮点数(正浮点数 + 0) |
^(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*))$ |
正浮点数 |
^((-\d+(\.\d+)?)|(0+(\.0+)?))$ |
非正浮点数(负浮点数 + 0) |
^(-(([0-9]+\.[0-9]*[1-9][0-9]*)|([0-9]*[1-9][0-9]*\.[0-9]+)|([0-9]*[1-9][0-9]*)))$ |
负浮点数 |
^(-?\d+)(\.\d+)?$ |
浮点数 |
^[A-Za-z]+$ |
由26个英文字母组成的字符串 |
^[A-Z]+$ |
由26个英文字母的大写组成的字符串 |
^[a-z]+$ |
由26个英文字母的小写组成的字符串 |
^[A-Za-z0-9]+$ |
由数字和26个英文字母组成的字符串 |
^\w+$ |
由数字、26个英文字母或者下划线组成的字符串 |
^[\w-]+(\.[\w-]+)*@[\w-]+(\.[\w-]+)+$ |
email地址 |
^[a-zA-z]+://(\w+(-\w+)*)(\.(\w+(-\w+)*))*(\?\S*)?$ |
url |
^(d{2}|d{4})-((0([1-9]{1}))|(1[1|2]))-(([0-2]([1-9]{1}))|(3[0|1]))$ |
年-月-日 |
^((0([1-9]{1}))|(1[1|2]))/(([0-2]([1-9]{1}))|(3[0|1]))/(d{2}|d{4})$ |
月/日/年 |
^([w-.]+)@(([[0-9]{1,3}.[0-9]{1,3}.[0-9]{1,3}.)|(([w-]+.)+))([a-zA-Z]{2,4}|[0-9]{1,3})(]?)$ |
Emil |
(d+-)?(d{4}-?d{7}|d{3}-?d{8}|^d{7,8})(-d+)? |
电话号码 |
^(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5]).(d{1,2}|1dd|2[0-4]d|25[0-5])$ |
IP地址 |