正则表达式字符解释
正则表达式中特殊字符
^:匹配字符串的开始位置,匹配^本身,使用转义符\^
$:匹配字符串的结尾位置,匹配$本身,使用转义符\$
.:代表匹配除了\n之外的任何字符
*:代表前面的字符可以出现0次,1次或者多次
+:代表前面的字符至少出现1次或者多次
?:代表前面的字符出现0次或者1次
|:代表二则选一
():标记一个子表达式的开始和结束
{}:限定符表达式的开始和结束
{n}:代表前面的字符匹配n次
{n,}:代表前面的字符至少匹配n次
{n,m}:代表前面的字符至少匹配n次,最多匹配m次
[xyz]:代表字符集,即匹配包含的任意字符
[^xyz]:代表非字符集,即匹配不包含的任意字符
[a-z]:代表字符范围,即匹配范围内的任意字符
(?:pattern):如instr(?:ry|riest)就是instry|instriest的简略形式
(?=pattern):如python(?=2.0|2.6|2.7)匹配python2.7,但不匹配python3.0
(?!pattern):如python(?!2.0|2.6|2.7)匹配python3.0,但不匹配python2.7
[[:alpha:]]:任何字母
[[:digit:]] :任何数字
[[:alnum:]]:任何字母和数字
[[:space:]]:任何空白字符
[[:upper:]]:任何大写字母
[[:lower:]]:任何小写字母
[[:punct:]]:任何标点符号
[[:xdigit:]]:任何16进制的数字,相当于[0-9a-fA-F]