常用正则表达式
everything搜索、notepad++文档搜索、网络爬虫等等,很多地方都会用到正则表达式,花点时间了解一下几个常用的:
- 元字符匹配
1-\bhi\b:匹配hi单词
2-\bhi\b.*\bLucy\b:hi不远处跟着一个Lucy
3-0\d{2}-\d{8}:\d,数字匹配。连续重复2次/8次
- 字符转义
如果查找* .本身就是正则表达式中的字符,需要\转义,\* \.
- 字符重复
1-Windows\d+:匹配Windows后面跟1个或多个数字
2-^\w+:一行的第一个单词
3-.*
.*:匹配任意文本(尽可能长) a.*b:匹配最长的以a开始,以b结束的字符串。
.*?:匹配任意文本(尽可能少) a.*?b:匹配最短的以a开始,以b结束的字符串。
- 结构语句
1-|:或 A | B
2-():分组,(\d{1,3}\.){3}\d{1,3},黄色部分为第一个表达式,匹配三位数字加上一个英文句号。 与其说是分组,不如理解成:范围的划定。
- 反义语句
1-\S+:匹配不包含空白符的字符串。
2-<a[^>]+>:匹配用尖括号括起来的以a开头的字符串。
其他用到再记录吧,参考:https://deerchao.net/tutorials/regex/regex.htm