累成一条狗

Java基础--正则表达式的规则

注意:正则表达式只关注格式是否正确,不关注内容是否有效。

一、字符集合, []表示一个字符。

  1、[abc] :指a,b,c中的任意一个字符。

  2、[^abc]:指除了a,b,c外的任意字符。

  3、[a-z]:表示a到z间的任意一个字符。

  4、[a-zA-Z0-9]:表示a到z,A到Z,0到9的任意一个字符。

  5、[a-z&&[^bc]]:等价于[ad-z],指a到z间除了b,c字符的任意字符。

 

二、预定义字符集* ( . )表示任意一个字符。

  1、\d : 数字字符集,相当于[0-9],

  2、\w:单词字符集,相当于[a-zA-Z0-9_]。
  3、\s:空白字符集,相当于[\t\n\f\r\xoB]。
  4、\D:非\d
  5、\W:非\w
  6、\S:非\s

 

三、数量词

  1、?表示0个或一个。
  2、* 表示0个或无穷个。
  3、+ 表示1个或无穷个。
  4、{n}表示n个。
  5、{n, }表示n个到无穷个。
  6、{n, m }表示n个到m个(m>n)。
  7、() 表示一个整体。比如:(\+86)就是表示+86,此时+需要转义。
  8、^在[]中表示非,而放在[]外,表示以……开头。比如^[0-9]就是以数字0-9开头。
  9、$表示以……结尾,比如[0-9]$就是指以数字0-9结尾。

 

四、java的String中正则表达式写法(转义的问题)

  1、11位手机号正则表达式: "^[0-9]{11}$" ;

  2、邮箱正则表达式:"^[a-zA-Z0-9_]+@[a-zA-Z0-9_]+(\.[a-zA-Z0-9])+$" ;此时若使用String regex = " [a-zA-Z0-9_]+@[a-zA-Z0-9_]+(\\.[a-zA-Z0-9])+ "; 由于java字符串认为 ( . ) 不需要进行转义,所以写成 ( \. )会报错,需要对 \ 进行转义, 即写成 ( \\. )

  3、简单的日期表达式:"^\\d{4}(\\-|\\/|\\.)\\d{1,2}\\1\\d{1,2}$"  ;  \1表示匹配第一个小括号的内容,即(\-|\/|\.)

 1 public class Test {
 2     public static void main(String[] args) {
 3         String regexDemo1 = "^\\d{4}(\\-|\\/|\\.)\\d{1,2}\\1\\d{1,2}$";
 4         String str = "2019.05.22";
 5         System.out.println(str.matches(regexDemo1)); // 返回true
 6 
 7         // regexDemo1等价于regexDemo2。 其 \1 指的即为第一个小括号(), 即 \1 指的是 (\-|\/|\.)
 8         String regexDemo2 = "^\\d{4}(\\-|\\/|\\.)\\d{1,2}(\\-|\\/|\\.)\\d{1,2}$";
 9         System.out.println(str.matches(regexDemo2)); // 返回true
10     }
11 }

 

五、字符串的替换与分解(使用正则表达式)

  1、public boolean matches(String regex);判断当前字符串对象是否与参数regex格式相匹配。
  2、public String replaceAll(String regex, String replacement);将字符串中符合regex格式的子串替换成replacement,此时并未改变原始字符串。

  3、public String[] split(String regex); 将字符串使用regex标记分割,并将分割后的单词存入字符串数组中。

 

 1 public class Test {
 2     public static void main(String[] args) {
 3         String regex = "[0-9]+";
 4         String str = "hello123world123";
 5         System.out.println("原始字符串为: " + str);//输出hello123world123
 6 
 7         System.out.println("替换字符串后为: " +str.replaceAll(regex, " welcome ")); //输出hello welcome world welcome 
 8         System.out.println("原字符串不变:" + str); //不会改变原来的字符串,输出为hello123world123
 9 
10         System.out.println("输出切割后的字符串: ");
11         String digitWord[] = str.split(regex); // 以regex格式分割
12         for (String s : digitWord) {
13             System.out.println(s);
14         }
15     }
16 }
17 /*
18 测试结果为:
19 原始字符串为: hello123world123
20 替换字符串后为: hello welcome world welcome 
21 原字符串不变:hello123world123
22 输出切割后的字符串: 
23 hello
24 world
25 */

 

posted on 2019-05-22 18:09  累成一条狗  阅读(3831)  评论(0编辑  收藏  举报

导航