Java正则表达式

1.什么是正则表达式

符合正确规则的字符串。

2.那么开始研究规则。

规则字符在java.util.regex.Pattern中(可查JDK文档).

3.规则非常之多,只研究常用的规则(以下为常用,红色为重点)

A:字符

x 字符 x。举例:'a'表示字符a(直接自己本身)

\\ 反斜线字符。
\n 新行(换行)符 ('\u000A') 
\r 回车符 ('\u000D')

B:字符类(把很多字符表示在一起)

[abc] a、b c(简单类)只能abc其中一个!! 

[^abc] 任何字符,除了 a、b 或 c(否定) 

[a-zA-Z] a到 z 或 A到 Z,两头的字母包括在内(范围 )只能是英文字母了

[0-9] 0到9的字符都包括


C:预定义字符类

. 表示任何字符。(但我的就是.字符本身,怎么表示呢? \.
\d 数字:

\d 数字:相当于[0-9]注意!!\要表示出来,所以最终写的是\\d,下同
\w 单词字符:[a-zA-Z_0-9]
在正则表达式里面组成单词的东西必须有这些东西组成

D:边界匹配器

^ 行的开头 
$ 行的结尾 
\b 单词边界
就是不是单词字符的地方。(例如下面的依次是 空格,问号,分号)
举例:hello world?haha;xixi


E:Greedy 数量词 (表示前面的规则重复次数相关的,上面没写次数的 默认一次)

\w 单词字符:[a-zA-Z_0-9]

在正则表达式里面组成单词的东西必须有这些东西组成



D:边界匹配器

^ 行的开头 

$ 行的结尾 

\b 单词边界

就是不是单词字符的地方。(例如下面的依次是 空格,问号,分号)

举例:hello world?haha;xixi


E:Greedy 数量词 (表示前面的规则重复次数相关的,上面没写次数的 默认一次)

X?     表示X一次或一次也没有(X表示上面的规则)
X*    表示 X零次或多次
X+    表示X一次或多次
X{n}  表示 X恰好 n 次 
X{n,}  表示X至少 n 次 

X{n,m}   表示X至少 n 次,但是不超过 m 次

X*    表示 X零次或多次

X+    表示X一次或多次

X{n}  表示 X恰好 n 次 

X{n,}  表示X至少 n 次 

X{n,m}

X{n,m}   表示X至少 n 次,但是不超过 m 次

X*    表示 X零次或多次

X+    表示X一次或多次

X{n}  表示 X恰好 n 次 

X{n,}  表示X至少 n 次 
X{n,m}

X{n,m}   表示X至少 n 次,但是不超过 m 次

4.正则表达式的应用

(1)常见功能:

A:判断功能

String类的public boolean matches(String regex)告知此字符串是否匹配给定的正则表达式

B:分割功能

String类的public String[] split(String regex)

C:替换功能

String类的public String replaceAll(String regex,String replacement)

D:获取功能

Pattern和Matcher

Pattern p = Pattern.compile("a*b");

Matcher m = p.matcher("aaaaab");


find():查找存不存在

group():获取刚才查找过的数据     

(2)案例(每个自己写一写)

A:判断电话号码和邮箱

B:按照不同的规则分割数据

C:把论坛中的数字替换为*

D:获取字符串中由3个字符组成的单词

5.下面给几个正则表达式的代码例子

邮箱鉴定(判断功能)

import java.util.Scanner;

/*
 * 校验邮箱
 * 
 * 分析:
 * 		A:键盘录入邮箱
 * 		B:定义邮箱的规则
 * 			1517806580@qq.com
 * 			liuyi@163.com
 * 			linqingxia@126.com
 * 			fengqingyang@sina.com.cn
 * 			fqy@itcast.cn
 * 		C:调用功能,判断即可
 * 		D:输出结果
 */
public class RegexTest {
	public static void main(String[] args) {
		//键盘录入邮箱
		Scanner sc = new Scanner(System.in);
		System.out.println("请输入邮箱:");
		String email = sc.nextLine();
		
		//定义邮箱的规则
		//String regex = "[a-zA-Z_0-9]+@[a-zA-Z_0-9]{2,6}(\\.[a-zA-Z_0-9]{2,3})+";
		String regex = "\\w+@\\w{2,6}(\\.\\w{2,3})+";
		
		//调用功能,判断即可
		boolean flag = email.matches(regex);
		
		//输出结果
		System.out.println("flag:"+flag);
	}
}
输出aa bb cc(分割功能)

/*
 * 分割功能练习
 */
public class RegexDemo2 {
	public static void main(String[] args) {
		// 定义一个字符串
		String s1 = "aa,bb,cc";
		// 直接分割
		String[] str1Array = s1.split(",");
		for (int x = 0; x < str1Array.length; x++) {
			System.out.println(str1Array[x]);
		}
		System.out.println("---------------------");

		String s2 = "aa.bb.cc";
		String[] str2Array = s2.split("\\.");
		for (int x = 0; x < str2Array.length; x++) {
			System.out.println(str2Array[x]);
		}
		System.out.println("---------------------");

		String s3 = "aa    bb                cc";
		String[] str3Array = s3.split(" +");
		for (int x = 0; x < str3Array.length; x++) {
			System.out.println(str3Array[x]);
		}
		System.out.println("---------------------");
		
	}
}
替换功能

/*
 * 替换功能
 *  	String类的public String replaceAll(String regex,String replacement)
 *  	使用给定的 replacement 替换此字符串所有匹配给定的正则表达式的子字符串。 
 */
public class RegexDemo {
	public static void main(String[] args) {
		// 定义一个字符串
		String s = "helloqq12345worldkh622112345678java";

		// 我要去除所有的数字,用*给替换掉
		// String regex = "\\d+";
		// String regex = "\\d";
		//String ss = "*";
		
		
		// 直接把数字干掉
		String regex = "\\d+";
		String ss = "";

		String result = s.replaceAll(regex, ss);
		System.out.println(result);
	}
}

抽取功能(第一个主要介绍使用,第二个为实例)
import java.util.regex.Matcher;
import java.util.regex.Pattern;

/*
 * 获取功能
 *		Pattern和Matcher类的使用
 *		
 *		模式和匹配器的基本使用顺序
 */
public class RegexDemo {
	public static void main(String[] args) {
		// 模式和匹配器的典型调用顺序
		// 把正则表达式编译成模式对象
		Pattern p = Pattern.compile("a*b");
		// 通过模式对象得到匹配器对象,这个时候需要的是被匹配的字符串
		Matcher m = p.matcher("aaaaab");
		// 调用匹配器对象的功能
		boolean b = m.matches();
		System.out.println(b);
		
		//这个是判断功能,但是如果做判断,这样做就有点麻烦了,我们直接用字符串的方法做
		String s = "aaaaab";
		String regex = "a*b";
		boolean bb = s.matches(regex);
		System.out.println(bb);
	}
}


import java.util.regex.Matcher;
import java.util.regex.Pattern;

/*
 * 获取功能:
 * 获取下面这个字符串中由三个字符组成的单词
 * da jia ting wo shuo,jin tian yao xia yu,bu shang wan zi xi,gao xing bu?
 */
public class RegexDemo2 {
	public static void main(String[] args) {
		// 定义字符串
		String s = "da jia ting wo shuo,jin tian yao xia yu,bu shang wan zi xi,gao xing bu?";
		// 规则
		String regex = "\\b\\w{3}\\b";

		// 把规则编译成模式对象
		Pattern p = Pattern.compile(regex);
		// 通过模式对象得到匹配器对象
		Matcher m = p.matcher(s);
		// 调用匹配器对象的功能
		// 通过find方法就是查找有没有满足条件的子串
		// public boolean find()
		// boolean flag = m.find();
		// System.out.println(flag);
		// // 如何得到值呢?
		// // public String group()
		// String ss = m.group();
		// System.out.println(ss);
		//
		// // 再来一次
		// flag = m.find();
		// System.out.println(flag);
		// ss = m.group();
		// System.out.println(ss);

		while (m.find()) {
			System.out.println(m.group());
		}

		// 注意:一定要先find(),然后才能group()
		// IllegalStateException: No match found
		// String ss = m.group();
		// System.out.println(ss);
	}
}



posted @ 2017-08-04 08:45  词汇族  阅读(174)  评论(0编辑  收藏  举报