常用正则表达式

everything搜索、notepad++文档搜索、网络爬虫等等,很多地方都会用到正则表达式,花点时间了解一下几个常用的:

  • 元字符匹配

1-\bhi\b:匹配hi单词

2-\bhi\b.*\bLucy\b:hi不远处跟着一个Lucy

3-0\d{2}-\d{8}:\d,数字匹配。连续重复2次/8次

  • 字符转义

如果查找* .本身就是正则表达式中的字符,需要\转义,\* \.

  • 字符重复

1-Windows\d+:匹配Windows后面跟1个或多个数字

2-^\w+:一行的第一个单词

3-.*

.*:匹配任意文本(尽可能长)   a.*b:匹配最长的以a开始,以b结束的字符串。

.*?:匹配任意文本(尽可能少) a.*?b:匹配最短的以a开始,以b结束的字符串。

  • 结构语句

1-|:或   A | B

2-():分组,(\d{1,3}\.){3}\d{1,3},黄色部分为第一个表达式,匹配三位数字加上一个英文句号。 与其说是分组,不如理解成:范围的划定。

  • 反义语句

1-\S+:匹配不包含空白符的字符串。
2-<a[^>]+>:匹配用尖括号括起来的以a开头的字符串。

 


 

 其他用到再记录吧,参考:https://deerchao.net/tutorials/regex/regex.htm

posted @ 2017-05-08 18:53  LeeLIn。  阅读(409)  评论(0编辑  收藏  举报