JAVA正则表达式基础入门
View Code
/*
* 这个类主要是为了解决正则表达式基础入门
*/
public class Test {
public static void main(String[] args) {
//.代表任意的一个字符(与行结束符可能匹配也可能不匹配)
p("abc".matches("..."));
//将数字替换为“-”,\d表示一个数字
p("a8729a".replaceAll("\\d", "-"));
//取值范围为a到z之间的所有字符,长度只有3
Pattern p = Pattern.compile("[a-z]{3}");
Matcher m = p.matcher("fgh");
p(m.matches());
//上面三句代码和下面一句代码意思是一致的
p("fgha".matches("[a-z]{3}"));
/*
//初步认识. * + ?
//.代表任意的一个字符
p("a".matches("."));
p("aa".matches("aa"));
//*代表0个或者是多个,前面必须有字符,不能单独使用,“a*”表示0个或者多个a
p("aaaa".matches("a*"));
//+代表1个或者是多个,前面必须有字符,不能单独使用,“a+”表示1个或者多个a
p("aaaa".matches("a+"));
p("".matches("a*"));//true
//?表示0个或者是1个,前面必须有字符,不能单独使用,“a?”表示0个或是1个a
p("aaaa".matches("a?"));//false
p("".matches("a?"));
p("a".matches("a?"));
//\d{3,100}表示至少有3个数字,至多有100个数字,{}表示匹配的字符的数量
p("214523145234532".matches("\\d{3,100}"));
p("192.168.0.aaa".matches("\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}\\.\\d{1,3}"));
//[0-2][0-9][0-9]匹配第一个数字范围在0到2之间,第二个在0到9之间,第三个在0到9之间
p("192".matches("[0-2][0-9][0-9]"));
*/
/*
//[]表示范围
p("a".matches("[abc]"));
//^表示除开[]里面以外的字符
//[^abc]表示abc以外的字符
p("a".matches("[^abc]"));
//下面三个都是a-z和A-Z,取两者的并集,只是三种不同的写法
p("A".matches("[a-zA-Z]"));
p("A".matches("[a-z]|[A-Z]"));
p("A".matches("[a-z[A-Z]]"));
//范围是A到Z并且是RFG,也就是说的取交集
p("R".matches("[A-Z&&[RFG]]"));
*/
//认识\s \w \d \
/*
* \s表示空白字符
* \w表示单词字符
* \d表示数字
* 上面的字母大写就表示小写的取反
*/
/*
p(" \n\r\t".matches("\\s{4}"));
p(" ".matches("\\S"));
p("a_8".matches("\\w{3}"));
p("abc888&^%".matches("[a-z]{1,3}\\d+[&^#%]+"));
p("\\".matches("\\\\"));
*/
//边界匹配
/*
//^表示行的开头,"^he.*"表示是以he开头,而不仅仅是针对h开头
p("hello sir".matches("^he.*"));
p("hillo sir".matches("^he.*"));
//$行的结尾,".*ir$"表示是以ir结尾,而不仅仅是针对r结尾
p("hello sdr".matches(".*ir$"));
p("hello sir".matches(".*ir$"));
//\b表示的是单词边界,\B表示的是非单词边界
p("hello sir".matches("^h[a-z]{1,3}o\\b.*"));
p("hellosir".matches("^h[a-z]{1,3}o\\b.*"));
p("hellosir".matches("^h[a-z]{1,3}o\\B.*"));
//whilte lines
p(" \n".matches("^[\\s&&[^\\n]]*\\n$"));
p("aaa 8888c".matches(".*\\d{4}."));
p("aaa 8888c".matches(".*\\b\\d{4}."));
p("aaa8888c".matches(".*\\d{4}."));
p("aaa8888c".matches(".*\\b\\d{4}."));
*/
//p("asdfasdfsafsf@dsdfsdf.com".matches("[\\w[.-]]+@[\\w[.-]]+\\.[\\w]+"));
/*
//matches()方法和find()方法相互影像
Pattern p = Pattern.compile("\\d{3,5}");
String s = "123-34345-234-00";
Matcher m = p.matcher(s);
//matches()方法会匹配所有的字符串,和\d{3,5}表达式去匹配,明显是不符合的
p(m.matches());//false
//如果不使用reset()方法,则匹配的字符串从34345-234-00开始,因为之前的123-被前面的matches()方法匹配了
m.reset();
//find()方法找子字符串,在这里必须先使用,不然后面的start()和end()方法不能正常使用
p(m.find());
p(m.start() + "-" + m.end());
p(m.find());
p(m.start() + "-" + m.end());
p(m.find());
p(m.start() + "-" + m.end());
p(m.find());
//如果没有使用上面的reset()方法,则使用下面的语句会抛异常
//p(m.start() + "-" + m.end());
//lookingAt()尝试将从区域开头开始的输入序列与该模式匹配。因此下面的四个输出总是true
p(m.lookingAt());
p(m.lookingAt());
p(m.lookingAt());
p(m.lookingAt());
*/
//replacement
//Pattern.CASE_INSENSITIVE表示匹配不区分大小写,将偶数java全部设为大写
/*
Pattern p = Pattern.compile("java", Pattern.CASE_INSENSITIVE);
Matcher m = p.matcher("java Java JAVa JaVa IloveJAVA you hateJava afasdfasdf");
StringBuffer buf = new StringBuffer();
int i=0;
while(m.find()) {
i++;
if(i%2 == 0) {
m.appendReplacement(buf, "java");
} else {
m.appendReplacement(buf, "JAVA");
}
}
m.appendTail(buf);
p(buf);
*/
//group
//(\\d{3,5})([a-z]{2})表达式分了三组,第一组是整体匹配,为第0组,(\\d{3,5})为第1组,([a-z]{2})为第二组
/*
Pattern p = Pattern.compile("(\\d{3,5})([a-z]{2})");
String s = "123aa-34345bb-234cc-00";
Matcher m = p.matcher(s);
//这里只有使用了find()方法,才能使用group()方法,不然会抛异常
while(m.find()) {
p(m.group());
}
System.out.println("找出只满足上面正则表达式其中一部分的情况——分组");
System.out.println("匹配(\\d{3,5})");
m.reset();
while(m.find()) {
//显示的是第一个括号的分组
p(m.group(1));
}
System.out.println("匹配([a-z]{2})");
m.reset();
while(m.find()) {
//显示的是第一个括号的分组
p(m.group(2));
}
*/
//qulifiers
/*
* (.{3,10}?)表示的是Reluctant(不情愿的)匹配模式,会从最少的去匹配,即3个开始,如果不匹配会逐步增加匹配数量
* (.{3,10}+)表示的是Possessive(独占的)匹配模式,会直接匹配最大的数量,即10个,但是不会往少了去匹配,这种方式效率比较高
* 如果s = "aaaa5bbbb65"这样就能和+独占匹配方式匹配了
* (.{3,10})表示的是greedy(贪婪的)匹配模式,会直接匹配最大的数量,如果不匹配,会自动的往数量小的地方去匹配
*/
/*
Pattern p = Pattern.compile("(.{3,10}+)[0-9]");
// Pattern p = Pattern.compile("(.{3,10}?)[0-9]");
// Pattern p = Pattern.compile("(.{3,10})[0-9]");
String s = "aaaa5bbbb6";
Matcher m = p.matcher(s);
if(m.find()){
p(m.group());
p(m.start() + "-" + m.end());
}
else
p("not match!");
*/
//non-capturing groups
/*
//表示最后一个字符为a,且a不被捕获
Pattern p = Pattern.compile(".{3}(?=a)");
String s = "444a66b";
Matcher m = p.matcher(s);
while(m.find()) {
p(m.group());
}
*/
}
public static void p(Object o) {
System.out.println(o);
}
}
回忆过去,珍惜现在,放眼未来