java基础---->正则表达式
一、正则表达式
正则表达式是一个重要的组成部分,主要的功能可以用于复杂的验证、替换、拆分等操作,
在JDK 1.4之后Java为了方便用户开发在JDK中已经加入了正则的支持,主要是在java.util.regex包中。
1、正则的作用
判断一个字符串是否由数字组成。
范例:如果现在不使用正则则采用的方式
·将一个字符串变成一个字符数组,之后分别判断数组中的每个内容是否是数字。
publicclass CheckNumberDemo01 { publicstaticvoid main(String[] args) { String str = "1234567"; boolean flag =true;// 假设是正确的 char c[] = str.toCharArray();// 将字符串变为字符数组 for (int x = 0; x < c.length; x++) { if (c[x] >'9' || c[x] < '0') { //不是数字 flag = false; } } if (flag) { System.out.println("是由数字组成!"); } else { System.out.println("不是由数字组成!"); } } }
此时功能确实完成了,但是这样编写太复杂了,而且此处只是完成了一个简单的验证。
范例:现在使用正则
publicclass CheckNumberDemo02 { publicstaticvoid main(String[] args) { String str = "1234s567"; if (str.matches("\\d+")) { System.out.println("是由数字组成!"); } else { System.out.println("不是由数字组成!"); } } }
两种方式很明显,第二种方式的操作更加简单,第二种就是采用了正则,其中的“\\d+”就是一个正则表达式的符号。
2、正则表达式的符号
构成正则的核心部分就是这些标记,这些标记都在Pattern类的DOC文档中有所说明。
1、 字符表示:
· \\:表示一个\
·字母:表示一个具体的字符,例如:A
· \t:表示的是“\t”的转义字符
· \n:表示的是“\n”的转义字符
2、 字符集:表示一串完整的字符
· [abc]:表示内容可能是a、b、c字母的任意一个
· [^abc]:表示内容可能不是a、b、c字母的任意一个
· [a-zA-Z]:全部的英文字母
· [0-9]:全部的数字
3、 特殊表达式
· .:表示任意的一个字符
· \d:与[0-9]的含义一样;\D:与[^0-9]含义一样
· \w:与[a-zA-Z0-9_]的含义一样;\W:取反
\s 表示空格
4、 表达式的出现次数:默认的情况以上的所有表达式都只能表示一个字符,如果要表示多个,则要加上次数
· X?:出现0次或1次
· X+:出现1次或多次
· X*:出现0次、1次或多次
· X{n}:出现正好n次
· X{n,m}:出现n~m次
· X{n,}:出现n次以上
如果要想操作以上的表达式,需要Pattern类Matcher两个类的支持。
3、Pattern类
Pattern类的主要功能是用于进行正则的匹配的规则验证,在此类中没有构造方法,所以构造方法被私有话了,只能使用:public static Pattern compile(String regex)
Pattern类的主要功能就是拆分:public String[] split(CharSequence input)
范例:验证拆分
import java.util.regex.Pattern; public class PatternDemo01 { public static void main(String[] args) { String str = "a1b22c333d4444e55555f"; Pattern pat = Pattern.compile("\\d+"); String s[] = pat.split(str);// 拆分 for (int x = 0; x < s.length; x++) { System.out.println(s[x]); } } }
结果为a b c d e f
4、Matcher类
Matcher类的主要功能是完成字符串的验证及替换的,但是如果要想取得此类的实例,必须依靠以下方法:
·方法:public Matcher matcher(CharSequence input)
Matcher的方法:
·验证:public boolean matches()
·替换:public String replaceAll(String replacement)
范例:例如美国的车牌号码的组成:12-335-222
import java.util.regex.Pattern; public class MatcherDemo01 { public static void main(String[] args) { String str = "11-234-45"; Pattern pat = Pattern.compile("\\d{2}-\\d{3}-\\d{2}"); Matcher mat = pat.matcher(str); if (mat.matches()) { System.out.println("验证通过!"); } } }
范例:完成替换
import java.util.regex.Matcher; import java.util.regex.Pattern; public class MatcherDemo03 { public static void main(String[] args) { String str = "a1b22c333d4444e55555f"; Pattern pat = Pattern.compile("\\d+"); Matcher mat = pat.matcher(str); System.out.println(mat.replaceAll("X")) ;//结果为aXbXcXdXeXf } }
二、String类对正则的支持(重点)
·验证:public boolean matches(String regex)
·拆分:public String[] split(String regex)
·替换:public String replaceAll(String regex,Stringreplacement)
范例:完成验证,验证email
publicclass StringMatch { publicstaticvoid main(String[] args) { String email = "aa@aa.com"; if (email.matches("\\w+@\\w+\\.\\w+")) { System.out.println("验证通过!"); } } }
范例:拆分
publicclass StringSplit { publicstaticvoid main(String[] args) { String ip = "192.168.1.2"; String s[] = ip.split("\\."); for (int x = 0; x < s.length; x++) { System.out.println(s[x]); } } }
以后在开发中使用最多的肯定是直接利用String操作正则,而Pattern类和Matcher类基本上是不使用的。