正则表达式

 

 

 正则表达式的概念:

是用于描述一组字符串特征的模式,用来匹配特定的字符串。 它的应用非常广泛,特别是在字符串处理方面。其常见的应用如下:

验证字符串,即验证给定的字符串或子字符串是否符合指定的特征,

例如,验证是否是合法的邮件地址、验证是否是合法的HTTP地址等等。

查找字符串,从给定的文本当中查找符合指定特征的字符串,这样比查找固定字符串更加灵活。

替换字符串,即查找到符合某特征的字符串之后将之替换。

提取字符串,即从给定的字符串中提取符合指定特征的子字符串。

字符:x

含义:代表的是字符x

例如:匹配规则为 "a",那么需要匹配的字符串内容就是 ”a”

字符:\\

含义:代表的是反斜线字符'\'

例如:匹配规则为"\\" 那么需要匹配的字符串内容就是 ”\”

字符:\t

含义:制表符

例如:匹配规则为"\t" ,那么对应的效果就是产生一个制表符的空间

字符:\n

含义:换行符

例如:匹配规则为"\n",那么对应的效果就是换行,光标在原有位置的下一行

字符:\r

含义:回车符

例如:匹配规则为"\r" ,那么对应的效果就是回车后的效果,光标来到下一行行首

字符类:[abc]

含义:代表的是字符a、b 或 c

例如:匹配规则为"[abc]" ,那么需要匹配的内容就是字符a,或者字符b,或字符c的一个

字符类:[^abc]

含义:代表的是除了 a、b 或 c以外的任何字符

例如:匹配规则为"[^abc]",那么需要匹配的内容就是不是字符a,或者不是字符b,或不是字符c的任意一个字符

字符类:[a-zA-Z]

含义:代表的是a 到 z 或 A 到 Z,两头的字母包括在内

例如:匹配规则为"[a-zA-Z]",那么需要匹配的是一个大写或者小写字母

字符类:[0-9]

含义:代表的是 0到9数字,两头的数字包括在内

例如:匹配规则为"[0-9]",那么需要匹配的是一个数字

字符类:[a-zA-Z_0-9]

含义:代表的字母或者数字或者下划线(即单词字符)

例如:匹配规则为" [a-zA-Z_0-9] ",那么需要匹配的是一个字母或者是一个数字或一个下滑线

预定义字符类:.

含义:代表的是任何字符

例如:匹配规则为" . ",那么需要匹配的是一个任意字符。如果,就想使用 . 的话,使用匹配规则"\\."来实现

预定义字符类:\d

含义:代表的是 0到9数字,两头的数字包括在内,相当于[0-9]

例如:匹配规则为"\d ",那么需要匹配的是一个数字

预定义字符类:\w

含义:代表的字母或者数字或者下划线(即单词字符),相当于[a-zA-Z_0-9]

例如:匹配规则为"\w ",,那么需要匹配的是一个字母或者是一个数字或一个下滑线

边界匹配器:^

含义:代表的是行的开头

例如:匹配规则为^[abc][0-9]$ ,那么需要匹配的内容从[abc]这个位置开始, 相当于左双引号

边界匹配器:$

含义:代表的是行的结尾

例如:匹配规则为^[abc][0-9]$ ,那么需要匹配的内容以[0-9]这个结束, 相当于右双引号

边界匹配器:\b

含义:代表的是单词边界

例如:匹配规则为"\b[abc]\b" ,那么代表的是字母a或b或c的左右两边需要的是非单词字符([a-zA-Z_0-9])

数量词:X?

含义:代表的是X出现一次或一次也没有

例如:匹配规则为"a?",那么需要匹配的内容是一个字符a,或者一个a都没有

数量词:X*

含义:代表的是X出现零次或多次

例如:匹配规则为"a*" ,那么需要匹配的内容是多个字符a,或者一个a都没有

数量词:X+

含义:代表的是X出现一次或多次

例如:匹配规则为"a+",那么需要匹配的内容是多个字符a,或者一个a 

数量词:X{n}

含义:代表的是X出现恰好 n 次

例如:匹配规则为"a{5}",那么需要匹配的内容是5个字符a 

数量词:X{n,}

含义:代表的是X出现至少 n 次

例如:匹配规则为"a{5, }",那么需要匹配的内容是最少有5个字符a 

数量词:X{n,m}

含义:代表的是X出现至少 n 次,但是不超过 m 次

例如:匹配规则为"a{5,8}",那么需要匹配的内容是有5个字符a 到 8个字符a之间

代码实现:

 1 public class Demo01 {
 2 
 3     public static void main(String[] args) {
 4         /*11位的手机号码,第1位为1,第2位为3、4、5、7、8中的一个,
 5         后面9位为0到9之间的任意数字。*/
 6     /*    String regex="1[34578][0-9]{9}";
 7         String str="13864399999";
 8         boolean flag=str.matches(regex);
 9         System.out.println(flag);*/
10         /*校验qq号码.
11         1: 要求必须是5-15位数字
12         2: 0不能开头*/
13         /*String regex="[1-9][0-9]{4,14}";
14         String str="2734156755";
15         boolean flag=str.matches(regex);
16         System.out.println(flag);*/
17         String str="192.168.1.1";
18         String regex="\\.";
19         String[] st=str.split(regex);
20         for(int i=0;i<st.length;i++){
21             System.out.println(st[i]);
22         }
23         method();
24     }
25         public static void method(){
26             String str="hellow1111Nihao2222";
27             String regex="[0-9]";
28             String s=str.replaceAll(regex, "*");
29             System.out.println(s);
30     }
31         public static void method1(){
32             String regex="[0-9A-Za-z_]+@[a-zA-Z0-9]+(\\.[a-zA-Z]+)+";
33             String email="2734156755@qq.com";
34             System.out.println(email.matches(regex));
35         }
36 
37 }

 

1.对输入的qq号进行匹配(qq匹配规则:长度为5-10位,纯数字组成,且不能以0开头。

1 String regex="[1-9][0-9]{4,9}";
2         String str="2405075517";
3         boolean flag=str.matches(regex);
4         System.out.println(flag);

 2.对输入的电话号码进行匹配(匹配要求:匹配成功的电话号码位数为11位的纯数字,

且以1开头,第二位必须是:3、7、8中的一位,即只匹配13*********、17*********、18*********的电话号码)

 

1 String regex1="1[378][0-9]{9}";
2         String st="18563458750";
3         boolean flag1=st.matches(regex1);
4         System.out.println(flag1);

3.对字符串“张三@@@李四@@王五@茅台”进行切割,去掉@符号。

1 String s="张三@@@李四@@王五@茅台";
2         String regex2="@+";
3         String[] at=s.split(regex2);
4         for(int i=0;i<at.length;i++){
5             System.out.println(at[i]);
6         }

 4.【以叠词切割】:如字符串"abccsasahhhz"按“叠词”来切割就变成了“ab”,“sasa”,“z”

因为“cc”、“hhh”都是叠词需要切割掉。现在请将字符串“张三@@@李四¥¥王五ssssssss江流儿”按照叠词切割。

1 String t="张三@@@李四¥¥王五ssssssss江流儿";
2         String regex3="(.)\\1+";
3         String[] a=t.split(regex3 );
4         for(int i=0;i<a.length;i++){
5             System.out.print(a[i]);
6         }

5.将字符串“张三@@@李四YYY王五*****王尼玛”中的叠词替换为:“、”

1     String s1="张三@@@李四YYY王五*****王尼玛";
2         String regex4="(.)\\1+";
3         String sr=s1.replaceAll(regex4, "、");
4         System.out.println(sr);
5     }

 

posted @ 2018-07-31 10:22  文昭  阅读(294)  评论(0编辑  收藏  举报