正则表达式匹配
匹配规则:
单字,预定义元字符:
. 除\n外的所有字符
\d 数字,等同于[0-9]
\D 非数字,等同于[^0-9]
\s 空白字符 \t\n\r\v
\S 所有非空白字符 等同于 [^ \t\n\r\v]
\w 字母数字字符[a-zA-Z0-9_]
\W 非字母数字字符[^a-zA-Z0-9_]
批量备选
量词:
? 指字符出现0次或者1次
* 0次或多次
+ 1或多次
特定{3,5}3到5之间范围
{n} 出现n次
{n,}至少n次
{,m}最多m次
贪婪与非贪婪模式
贪婪 尽量匹配最大的结果 匹配处理,可以在量词后加?处理如:.*? <a>.*? </a>匹配所有A标签内容
非贪婪:尽量匹配最小的结果
边界匹配
^表示行首
$表示行尾
\b单词边界
\B非单词边界
\A输入开头
\Z输入结尾