1. 正则表达式基本语法
实战网址:https://tool.oschina.net/regex
普通正则:
扩展正则:
普通字符:
普通字符包括没有显式指定为元字符的所有可打印和不可打印字符。这包括所有大写和小写字母、所有数字、所有标点符号和一些其他符号。
非打印字符:
\cx:匹配由x指明的控制字符。例如, \cM 匹配一个 Control-M 或回车符。x 的值必须为 A-Z 或 a-z 之一。否则,将 c 视为一个原义的 ‘c’ 字符。
\f:匹配一个换页符。
\n:匹配一个换行符。
\r:匹配一个回车符。
\s:匹配任何空白字符,包括空格、制表符、换页符等等。
\S:匹配任何非空白字符。
\t:匹配一个制表符。
\v:匹配一个垂直制表符。
特殊字符:
$:匹配输入字符串的结尾位置。
( ):标记一个子表达式的开始和结束位置。子表达式可以获取供以后使用。要匹配这些字符,请使用 ‘\(‘ 和’\)’。
*:匹配前面的子表达式零次或多次。
+:匹配前面的子表达式一次或多次。
.:匹配除换行符 \n 之外的任何单字符。
[:标记一个中括号表达式的开始。
?:匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。
\:将下一个字符标记为或特殊字符、或原义字符、或向后引用、或八进制转义符。
^:匹配输入字符串的开始位置,除非在方括号表达式中使用,此时它表示不接受该字符集合。
{:标记限定符表达式的开始。
|:指明两项之间的一个选择。
限定符:
*:匹配前面的子表达式零次或多次。
+:匹配前面的子表达式一次或多次。
?:匹配前面的子表达式零次或一次,或指明一个非贪婪限定符。
{n}:n 是一个非负整数。匹配确定的 n 次。
{n,}:n 是一个非负整数。至少匹配n 次。
{n,m}:m 和 n 均为非负整数,其中n <= m。最少匹配 n 次且最多匹配 m 次。
定位符:
^:匹配输入字符串的开始位置,除非在方括号表达式中使用,此时它表示不接受该字符集合。
$:匹配输入字符串的结尾位置。
\b:匹配一个字边界,即字与空格间的位置。
\B:非字边界匹配。
注:不能将限定符与定位点一起使用。由于在紧靠换行或者字边界的前面或后面不能有一个以上位置,因此不允许诸如 ^* 之类的表达式。