正则表达式
-
- 正则表达式 :
正则表达式是处理文本的利器。
元字符从功能上大致分为:
- 限定符
- 选择匹配符
- 分组组合和反向引用符
- 特殊字符
- 字符匹配符
- 定位符
转义字符:
\\
需要用到转义字符的字符有以下:.*+()$/\?[]^{}
选择匹配符:
1. [a-z] 表示可以匹配a-z中任意一个字符,
2. java正则表达式默认区分大小写,实现不区别大小写的几个方法:
(?i)abc 表示abc都不区分大小写
a(?i)bc 表示bc不区分大小写
a(?i(b))c 表示 b 不区分大小写
Pattern pattern = Pattern.compile(regStr, Pattern.CASE_INSENSITIVE);
3. [^a-z] 表示可以匹配不是a-z其中的任一字符
4. [abcd] 表示匹配abcd其中一个
5. [^abc] 表示匹配除abc之外的任意字符
6. \\d 表示可以匹配0-9的任意字符 相当于[0-9]
7. \\D 表示可以匹配不是0-9的任意字符 <=> [^0-9]
8. \\w 表示匹配任意英文字符、数字和下划线,相当于[a-zA-Z0-9_]
9. \\s 匹配任何空白字符(空格,制表符等)
10. \\S 匹配任何非空白字符,和\s相反
11. \\W 相当于[^a-zA-Z0-9_]与\w相反
12. 匹配出\n 之外的所有字符,如果要匹配,本身则需要使用\\
13. 符号:| 表示匹配“|”之前或之后的表达式 示例 ab|cd :ab或cd