正则表达式

正则表达式

正则表达式定义

通常用来判断语句中,用来检查某一字符串是否满足某一格式

正则表达式组成

正则表达式是由普通字符与元字符组成

普通字符:包括大小写字母、数字、标点符号及一些其它符号。

元字符:是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前的字符表达式)在目标对象中的出现模式

常见的基础正则表达式元字符:(支持工具:grep、egrep、sed、awk)

元字符 作用
\ 转义符,用于取消特殊符号的含义。
^ 匹配字符串开始的位置。
$ 匹配字符串结束的位置。
. 匹配除\n之外的任意一个字符。
* 匹配前面子表达式0次或多次。
[abc] 匹配列表中的任意一个字符。
[^abc] 匹配非列表内的任意一个字符。
\ 匹配前面的子表达式n次。
\ 匹配前面的子表达式不少于n次。
\ 匹配前面的子表达式n到m次。
注:egrep、awk使用{n}{n,}{n,m}匹配时{}前不需要加\
\w 匹配包括下划线的任意单词字符。
\W 匹配任意非单词字符。
\s 空字符。
\S 非空字符。

示例:

扩展正则表达式元字符:(支持工具:egrep、awk 、grep -E、sed -r)

元字符 作用
+ 匹配前面子表达式1次以上。
匹配前面子表达式0次或者1次。
() 将括号内的字符串当作一个整体。
| 以或的方式匹配字符串。

posted @ 2022-04-18 15:02  GENGBO  阅读(50)  评论(0编辑  收藏  举报