正则表达式
正则表达式
目录
正则表达式定义
通常用来判断语句中,用来检查某一字符串是否满足某一格式
正则表达式组成
正则表达式是由普通字符与元字符组成
普通字符:包括大小写字母、数字、标点符号及一些其它符号。
元字符:是指在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前的字符表达式)在目标对象中的出现模式
常见的基础正则表达式元字符:(支持工具:grep、egrep、sed、awk)
元字符 | 作用 |
---|---|
\ | 转义符,用于取消特殊符号的含义。 |
^ | 匹配字符串开始的位置。 |
$ | 匹配字符串结束的位置。 |
. | 匹配除\n之外的任意一个字符。 |
* | 匹配前面子表达式0次或多次。 |
[abc] | 匹配列表中的任意一个字符。 |
[^abc] | 匹配非列表内的任意一个字符。 |
\ | 匹配前面的子表达式n次。 |
\ | 匹配前面的子表达式不少于n次。 |
\ | 匹配前面的子表达式n到m次。 |
注:egrep、awk使用{n}{n,}{n,m}匹配时{}前不需要加\ | |
\w | 匹配包括下划线的任意单词字符。 |
\W | 匹配任意非单词字符。 |
\s | 空字符。 |
\S | 非空字符。 |
示例:
扩展正则表达式元字符:(支持工具:egrep、awk 、grep -E、sed -r)
元字符 | 作用 |
---|---|
+ | 匹配前面子表达式1次以上。 |
? | 匹配前面子表达式0次或者1次。 |
() | 将括号内的字符串当作一个整体。 |
| | 以或的方式匹配字符串。 |