正则表达式
一、定义
Regular Expression,计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
二、普通字符
字母,下划线,数字,一些字符,直接写,代表字符本身
三、字符集
1、标准字符集
① \w 字母,数字,下划线 中的一个
② \d 0~9中的一个
③ \s 空白符中的一个
注:大写相反
2、自定义字符集
用[ ]表示, 里面中写,^取反,-至
例如:[^a-d] 出a,b,c,d外的所有字符
四、匹配次数
{n} n次
{m,n} 至少m次,至多n次
{m,} 至少m次
? {0,1}
+ {1,}
* {0,}
另:贪婪模式(默认)
后面加上? ==》 非贪婪模式
五、位置
^ 开头
$ 结尾
\b 单词边界,与\W相识
例子:\ba\b a
\Wa\W a
六、或与分组
| 或
( )括号内为整体
\3 反向应用,代表第三个括号(左数)的整体,类推