JAVA正则表达式匹配符
Java中正则表达式与之前使用的Python是有区别的,区别在于Java对于反斜线()处理的不同。
在Python中"\d"表示 匹配一位数字(0-9),而Java中匹配一位数字(0-9),需要的正则表达式为"\d"。
不过换行符和制表符只需要单反斜线“\n\t”。
字符
字符 |
描述 |
B |
指定字符B |
\xhh |
十六进制值为oxhh的字符 |
\uhhhh |
十六进制值为oxhhhh的Unicode字符 |
\t |
tab |
\n |
换行 |
\r |
回车 |
\e |
转义 |
字符类
字符类 |
描述 |
. (小数点) |
任意字符 |
[abc] |
[ ] 中括号,包含a,b,c中任意字符 |
[^abc] |
[ ]中括号加^, 表示否定,除a,b,c之外的 |
[a-z] |
从a到z的任意字符 |
[a-z&&[hi]] |
&&表示交集,即包含h或i |
\s |
空白字符,包含空格,换行,回车,tab,换页 |
\S |
大写为小写的取反,非空白字符,等价于[^\s] |
\d |
数字0-9 |
\D |
非数字,等价于[^0-9] |
\w |
词字符,数字,大小写字母,等价于[0-9a-zA-Z] |
\W |
非词,等价于[^\w] |
逻辑操作符
逻辑操作符 |
描述 |
XY |
Y跟在X后面,并且XY同时满足 |
X|Y |
X或者Y |
(X) |
() 小括号表示捕获组(group),可以对group进行处理,尤其是获取其中的内容 |
边界匹配符
边界匹配符 |
描述 |
^ |
一行的开始 |
$ |
一行的结束 |
\b |
词的边界 |
量词
量词描述了一个模式匹配文本的方式,包含
- 贪婪型:量词默认是贪婪的,发现尽可能多的匹配
- 勉强型:通过问号(?)指定,匹配最小的字符数,也称为懒惰型,最少匹配,非贪婪。
- 占有型:通过加号(+)指定,当用于字符串时防止匹配失败时回溯。
贪婪型 |
勉强型 |
占有型 |
描述 |
X? |
X?? |
X?+ |
匹配0个或1个X |
X* |
X*? |
X*+ |
匹配0个或多个X |
X+ |
X+? |
X++ |
匹配1个或多个X |
X |
X{n}? |
X{n}+ |
恰好匹配n个X |
X |
X{n,}? |
X{n,}+ |
至少匹配n个X |
X |
X{n,m}? |
X{n,m}+ |
至少匹配n个X,最多匹配m个X |