正则表达式中的元字符

①  元字符

所谓元字符,就是用于构建正则表达式的具有特殊含义的字符。例如:+*?

1) 限定符

所谓限定符,就是限定一个原子必须出现多少次:* + {n} {n,} {n,m}

*:代表一个原子出现0次或者多次

 

+:代表一个原子出现1次或者多次

 

?:代表一个原子要么出现1次,要么出现0

 

{n}:前面的原子出现几次

 

{n,}:前面的原子至少出现n

 

{n,m}:前面的原子至少出现n次,最多m

 

*{0,}

+:{1,}

?:{0,1}

 

2) 边界限定符

一共有4^ $ \b \B

^:字符串是否以某一个字符串开头

 

$:字符串是否以某一个字符串结尾

 

\b\B

\b :是边界

\B :  不是边界

 

 

3)点.

可以匹配任何一个除了换行符以外的字符

 

4)模式选择符 |

 

 

5) 模式单元

所谓模式单元,就是可以使用()将多个原子组合成一个更大的原子

 

One:将小原子组合成了一个大原子

Two:改变元字符的优先级

 

Three:开启了独立的模式,会将小括号里面的内容存入到缓冲区里面

被存入到缓冲区里面的内容可以通过\1 \2 \3来进行反向引用

 

缓冲区是可以被跳过的,通过一个?:来跳过缓冲区

 

 

6) 元字符的优先级

 

元字符

优先级

\

1

()  ?:  []

2

+ * ? {n} {n,} {n,m}

3

^ $ \b \B

4

|

5

posted @ 2017-08-20 20:02  胡智杰  阅读(589)  评论(0编辑  收藏  举报