正则表达式用于数据清洗

在平时调试过程中,有时候需要打印很多高频log,通过正则表达式可以很轻易的匹配出需要的信息。

常用语法:

[ABC] 匹配 [...] 中的所有字符
[^ABC] 匹配除了 [...] 中字符的所有字符
[A-Z] [A-Z] 表示一个区间,匹配所有大写字母,[a-z] 表示所有小写字母
. 匹配除换行符(\n、\r)之外的任何单个字符,相等于 [^\n\r]
[\s\S] 匹配所有。\s 是匹配所有空白符,包括换行,\S 非空白符,包括换行
\w 匹配字母、数字、下划线。等价于 [A-Za-z0-9_]
\n 匹配一个换行符。等价于 \x0a 和 \cJ
\r 匹配一个回车符。等价于 \x0d 和 \cM
\ 转义
$ 匹配前面的子表达式零次或多次。要匹配 * 字符,请使用 \*
+ 匹配前面的子表达式一次或多次。要匹配 + 字符,请使用 \+
^ 匹配输入字符串的开始位置,除非在方括号表达式中使用,当该符号在方括号表达式中使用时,表示不接受该方括号表达式中的字符集合
? 匹配前面的子表达式零次或一次
* 匹配前面的子表达式零次或多次

 

举例:

匹配以error开头的整行字符串

^error.*$

 

匹配以error结尾的整行字符串

^.*error$

 

如下匹配任意含error的整行

^.*error.*$

 

 

posted @ 2020-08-31 13:52  咸鱼翻身!  阅读(1073)  评论(0编辑  收藏  举报