【初识】正则表达式
什么是正则表达式?
正则表达式,又称正则表示法、常规表示法(Regular Expression),正则表达式使用单个字符串来描述、匹配一系列符合某个语法规则的字符串。在很多文本编辑器里,正则表达式常用于检索、替换那些符合某个模式的文本。
C#中正则表达式类是Regex类,位于System.Text.RegularExpressions命名空间下。
符号
一些常用的元字符
. 匹配除换行符(\n)以外的任意字符
\w 匹配字母或数字或下划线或汉字
\W 匹配任意不是字母,数字,下划线,汉字的字符
\s 匹配任意的空白符(TAB、换行符、中文全角空格)
\S 匹配任意不是空白符的字符
\d 匹配数字
\D 匹配任意非数字的字符;相当于[^0-9]
\b 匹配单词的开始或结束
\B 匹配不是单词开头或结束的位置
^ 匹配字符串的开始
[^x] 匹配除了x以外的任意字符(取反)
$ 匹配字符串的结束
\ 转义符;如要匹配 \ 则写 \\
一些常用的限定符
* 重复0次或更多次
+ 重复1次或更多次
? 重复0次或1次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n次到m次
| 或
[] 匹配[]内的字符;如[a]匹配a
() 提高优先级
测试工具:http://pan.baidu.com/s/1nttiOPj