2018年4月3日JAVA正则表达式
1匹配验证-验证Email是否正确
public static void main(String[] args) { // 要验证的字符串 String str = "service@xsoftlab.net"; // 邮箱验证规则 String regEx = "[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\\.){1,3}[a-zA-z\\-]{1,}"; // 编译正则表达式 Pattern pattern = Pattern.compile(regEx); // 忽略大小写的写法 // Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE); Matcher matcher = pattern.matcher(str); // 字符串是否与正则表达式相匹配 boolean rs = matcher.matches(); System.out.println(rs); }
2在字符串中查询字符或者字符串
public static void main(String[] args) { // 要验证的字符串 String str = "baike.xsoftlab.net"; // 正则表达式规则 String regEx = "baike.*"; // 编译正则表达式 Pattern pattern = Pattern.compile(regEx); // 忽略大小写的写法 // Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE); Matcher matcher = pattern.matcher(str); // 查找字符串中是否有匹配正则表达式的字符/字符串 boolean rs = matcher.find(); System.out.println(rs); }
3常用正则表达式
规则 正则表达式语法 一个或多个汉字 ^[\u0391-\uFFE5]+$ 邮政编码 ^[1-9]\d{5}$ QQ号码 ^[1-9]\d{4,10}$ 邮箱 ^[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\.){1,3}[a-zA-z\-]{1,}$ 用户名(字母开头 + 数字/字母/下划线) ^[A-Za-z][A-Za-z1-9_-]+$ 手机号码 ^1[3|4|5|8][0-9]\d{8}$ URL ^((http|https)://)?([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ 18位身份证号 ^(\d{6})(18|19|20)?(\d{2})([01]\d)([0123]\d)(\d{3})(\d|X|x)?$
4正则表达式语法
元字符 |
描述 |
\ |
将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。 |
^ |
匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。 |
$ |
匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。 |
* |
匹配前面的子表达式任意次。例如,zo*能匹配“z”,“zo”以及“zoo”。*等价于{0,}。 |
+ |
匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。 |
? |
匹配前面的子表达式零次或一次。例如,“do(es)?”可以匹配“do”或“does”中的“do”。?等价于{0,1}。 |
{n} |
n是一个非负整数。匹配确定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o。 |
{n,} |
n是一个非负整数。至少匹配n次。例如,“o{2,}”不能匹配“Bob”中的“o”,但能匹配“foooood”中的所有o。“o{1,}”等价于“o+”。“o{0,}”则等价于“o*”。 |
{n,m} |
m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}”将匹配“fooooood”中的前三个o。“o{0,1}”等价于“o?”。请注意在逗号和两个数之间不能有空格。 |
? |
当该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如,对于字符串“oooo”,“o+?”将匹配单个“o”,而“o+”将匹配所有“o”。 |
.点 |
匹配除“\r\n”之外的任何单个字符。要匹配包括“\r\n”在内的任何字符,请使用像“[\s\S]”的模式。 |
(pattern) |
匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“\(”或“\)”。 |
(?:pattern) |
匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。 |
(?=pattern) |
正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。 |
(?!pattern) |
正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。 |
(?<=pattern) |
反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。 |
(?<!pattern) |
反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。 |
x|y |
匹配x或y。例如,“z|food”能匹配“z”或“food”或"zood"(此处请谨慎)。“(z|f)ood”则匹配“zood”或“food”。 |
[xyz] |
字符集合。匹配所包含的任意一个字符。例如,“[abc]”可以匹配“plain”中的“a”。 |
[^xyz] |
负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。 |
[a-z] |
字符范围。匹配指定范围内的任意字符。例如,“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。 注意:只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围; 如果出字符组的开头,则只能表示连字符本身. |
[^a-z] |
负值字符范围。匹配任何不在指定范围内的任意字符。例如,“[^a-z]”可以匹配任何不在“a”到“z”范围内的任意字符。 |
\b |
匹配一个单词边界,也就是指单词和空格间的位置(即正则表达式的“匹配”有两种概念,一种是匹配字符,一种是匹配位置,这里的\b就是匹配位置的)。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”。 |
\B |
匹配非单词边界。“er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er”。 |
\cx |
匹配由x指明的控制字符。例如,\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则,将c视为一个原义的“c”字符。 |
\d |
匹配一个数字字符。等价于[0-9]。 |
\D |
匹配一个非数字字符。等价于[^0-9]。 |
\f |
匹配一个换页符。等价于\x0c和\cL。 |
\n |
匹配一个换行符。等价于\x0a和\cJ。 |
\r |
匹配一个回车符。等价于\x0d和\cM。 |
\s |
匹配任何不可见字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。 |
\S |
匹配任何可见字符。等价于[^ \f\n\r\t\v]。 |
\t |
匹配一个制表符。等价于\x09和\cI。 |
\v |
匹配一个垂直制表符。等价于\x0b和\cK。 |
\w |
匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”,这里的"单词"字符使用Unicode字符集。 |
\W |
匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。 |
\xn |
匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,“\x41”匹配“A”。“\x041”则等价于“\x04&1”。正则表达式中可以使用ASCII编码。 |
\num |
匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,“(.)\1”匹配两个连续的相同字符。 |
\n |
标识一个八进制转义值或一个向后引用。如果\n之前至少n个获取的子表达式,则n为向后引用。否则,如果n为八进制数字(0-7),则n为一个八进制转义值。 |
\nm |
标识一个八进制转义值或一个向后引用。如果\nm之前至少有nm个获得子表达式,则nm为向后引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的向后引用。如果前面的条件都不满足,若n和m均为八进制数字(0-7),则\nm将匹配八进制转义值nm。 |
\nml |
如果n为八进制数字(0-7),且m和l均为八进制数字(0-7),则匹配八进制转义值nml。 |
\un |
匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如,\u00A9匹配版权符号(©)。 |
\< \> | 匹配词(word)的开始(\<)和结束(\>)。例如正则表达式\<the\>能够匹配字符串"for the wise"中的"the",但是不能匹配字符串"otherwise"中的"the"。注意:这个元字符不是所有的软件都支持的。 |
\( \) | 将 \( 和 \) 之间的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域(一个正则表达式中最多可以保存9个),它们可以用 \1 到\9 的符号来引用。 |
| | 将两个匹配条件进行逻辑“或”(Or)运算。例如正则表达式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。注意:这个元字符不是所有的软件都支持的。 |
+ | 匹配1或多个正好在它之前的那个字符。例如正则表达式9+匹配9、99、999等。注意:这个元字符不是所有的软件都支持的。 |
? | 匹配0或1个正好在它之前的那个字符。注意:这个元字符不是所有的软件都支持的。 |
{i} {i,j} | 匹配指定数目的字符,这些字符是在它之前的表达式定义的。例如正则表达式A[0-9]{3} 能够匹配字符"A"后面跟着正好3个数字字符的串,例如A123、A348等,但是不匹配A1234。而正则表达式[0-9]{4,6} 匹配连续的任意4个、5个或者6个数字 |
DATE类
一:Date类
1.使用Date类代表当前系统时间
Date date = new Date(); System.out.println(date);
使用Date类的默认构造方法创建出来的对象就代表当前的时间,由于Date类覆盖了toString()方法。所以可以直接输出Date类型的对象,显示的结果如下:
Sun Aug 28 10:23:06 CST 2016
在该格式中,Sun代表Sunday(周日),Aug 代表August(八月),28代表288号,CST代表China Standard Time(中国标准时间,也就是北京时间(东八区))。
2.使用Date类代表指定时间
Date date = new Date(2016-1900,8-1,28); System.out.println(date);
使用带参的构造方法,可以构造指定日期的Date类对象,Date类中年份的参数应该是实际需要代表的年份减去1900,实际需要代表的月份减去1以后的值。显示结果如下:
Sun Aug 28 00:00:00 CST 2016 代表的日期就是2016年8月28号
实际代表的年月日时分秒的日期对象和这个类似。
3.获取Date对象中的信息
使用Date类中的get方法,可以获得Date类对象的相关信息(但可以看出,Date类中的这些方法都已经过时)。需要注意的是使用getYear获得的是Date对象中年份减去1900以后的值,所以需要显示对应的年份则需要在返回值的基础上加1900,月份类似。在Date类中还提供了getDay方法,用于获得Date对象代表的时间是星期几,Date类规定周日是0,周一是1,周二是2,后续的依次类推。
4.Date对象和相对时间的互转
Date date = new Date(2016-1900,8-1,28); long time = 1290876532190L;
//将Date类的对象转换为相对时间 long t = date.getTime(); System.out.println(t); //结果是:1472313600000 //将相对时间转换为Date类的对象 Date da = new (time); System.out.println(da); //结果是:Sun Aug 28 00:00:00 CST 2016
5.Date对象之间的比较
Date date = new Date(2016-1900,8-1,28); Date date1 = new Date(); date.compareTo(date1)返回int类型。如果等于0,则date=date1;如果小于0,则date<date1;
使用Date对象中的getTime方法,可以将Date类的对象转换为相对时间,使用Date类的构造方法,可以将相对时间转换为Date类的对象。经过转换以后,既方便了时间的计算,也使时间显示比较直观了。
二:Calendar类
从JDK1.1版本开始,在处理日期和时间时,系统推荐使用Calendar类进行实现(Date的一些方法都过时了)。在设计上,Calendar类的功能要比Date类强大很多,而且在实现方式上也比Date类要复杂一些,下面就介绍一下Calendar类的使用。
Calender类是一个抽象类,在实际使用时实现特定的子类的对象,创建对象的过程对程序员来说是透明的,只需要使用getInstance()方法创建即可。
1.使用Calendar类代表当前时间
Calendar c = Calendar.getInstance(); System.out.println(c); //返回的是一个Calendar对象
由于Calendar类是抽象类,且Calendar类的构造方法是protected的,所以无法使用Calendar类的构造方法来创建对象,API中提供了getInstance方法用来创建对象。使用该方法获得的Calendar对象就代表当前的系统时间,由于Calendar类toString实现的没有Date类那么直观,所以直接输出Calendar类的对象意义不大。
2.使用Calendar类代表指定的时间
Calendar c1 = Calendar.getInstance();
c1.set(2016,8-1,28);
使用过Calendar类代表特定的时间,需要首先创建一个Calendar的对象,然后在设定该对象中的年月日参数来完成。
set方法的声明为:public final void set(int year,int month,int date)
以上示例代码设置的时间为2016年8月28日,其参数的结构和Date类不一样。Calendar类中年份的数值直接书写,月份的值为实际的月份值减1,日期的值就是实际的日期值。
如果只设定某个字段某个字段,例如日期的值,则可以使用如下set方法:
public void set(int field,int value)
在该方法中,参数field代表要设置的字段的类型,常见类型如下:
Calendar.YEAR---年份;Calendar.MONTH---月份; Calendar.DATE---日期; Calendar.DAY_OF_MONTH---日期,和Calendar.DATE字段完全相同;
Calendar.HOUR---12小时制的小时数;Calendar.HOUR_OF_DAY---24小时制的小时数;Calendar.MINUTE---分钟;Calendar.SECOND---秒;Calendar.DAY_OF_WEEK---星期几。
后续的参数value代表设置成的值。例如:c1.set(Calendar.DATE,10);该代码的作用是将c1对象代表的时间中日期设置为10号,其它所有的数值会被重新计算,例如星期几以及对应的相对时间数值等。
3.获得Calendar类中的信息
在Calendar类中,周日是1,周一是2,周二是3,依次类推。
4.其他方法说明
其实Calendar类中还提供了很多其他有用的方法,下面简单的介绍几个常见方法的使用。
(1)add方法
public abstract void add(int field,int amount)
该方法的作用是在Calendar对象中的某个字段上增加或减少一定的数值,增加是amount的值为正,减少是amount的值为负。
例如计算当前时间100天以后的日期,代码如下:
Calendar c3 = Calendar.getInstance(); c3.add(Calendar.DATE,100); int year = c3.get(Calendar.YEAR); int month = c3.get(Calendar.MONTH); int date = c3.get(Calendar.DATE); System.out.println(year+"年"+month+"月"+date+"日");
这里add方法是指在c3对象的Calendar.DATE,也就是日期字段上增加100,类内部会重新计算该日期对象中其它各字段的值,从而获得100天以后的 日期,例如程序的输出结果可能为:2016年11月6日
(2)after方法
public boolean after(Object when)
该方法的作用是判断当前日期对象是否在when对象的后面,如果在when对象的后面则返回true,否则返回false。例如:
Calebdar c4 = Calendar.getInstance(); c4.set(2016,8-1,28); Calendar c5 = Calendar.getInstance();c5.set(2016,10-1,1); boolean b = c5.after(c4); System.out.println(b);
在该示例代码中对象c4代表的时间是2016年8月28号,对象c5代表的时间是2016年10月1号,则对象c5代表的日期在c4代表的日期之后,所以after 方法的返回值是true。
另外一个类似的方法是before,该方法是判断当前日期对象是否位于另外一个日期对象之前。
5.Calendar对象和相对时间之间的转换
Calendar c6 = Calendar.getInstance(); long t = 1252785271098L; //将Calendar对象转换为相对时间 long t1 = c6.getTimeInMillis(); //将相对时间转换成Calendar对象 Calendar c9 = Calendar.getInstance(); c9.setTimeInMillis(t1); 在转换时,使用Calendar类中的getTimeInMillis方法可以将Calendar对象转换为相对时间。在将相对时间转换为Calendar对象时,首先创建一个Calendar对象,然后再使用Calendar类的setTimeInMillis方法设置时间即可。
1计算两个日期之间相差的天数
例如计算2016年8月20号和2016年8月29号之间相差的天数。该程序实现的原理为:首先代表两个特定的时间点,这里使用Calendar的对象进行代表,然后将两个时间点转换为对应的相对时间,求两个时间点相对时间的差值,然后除以一天的毫秒数(24小时*60分钟*60秒*1000毫秒)即可获得对应的天数。实现该示例的完整代码如下:
5.2输出当月的日历
该示例的功能是输出当前系统时间所在月的日历,例如当前系统时间是2016年8月29日,则输出2016年8月的日历。
该程序实现的原理为:首先获得该月1号是星期几,然后获得该月的天数,最后使用流程控制实现按照日历的格式进行输出即可。即如果1号是星期一,则打印一个单位的空格,如果1号是星期二,则打印两个单位的空格,依次类推。打印完星期六的日期以后,进行换行。实现该示例的完整代码如下:
作业练习总结:
1.如何获取当前的月份?
package d02; import java.util.Calendar; import java.util.Date; public class t01 { public static void main(String[] args) { // TODO Auto-generated method stub Calendar c=Calendar.getInstance(); int m=c.get(Calendar.MONTH)+1; System.out.println(m+"月"); } }
2.如何知道现在距离指定的时间还有多久?
package d02; import java.util.Calendar; public class t02 { public static void main(String[] args) { Calendar c=Calendar.getInstance(); Calendar c2=Calendar.getInstance(); c.set(Calendar.YEAR, 2019); c.set(Calendar.MONTH, 10); c.set(Calendar.DATE, 1); long l1=c.getTimeInMillis(); long l2=c2.getTimeInMillis(); System.out.println("距离当前时间还有:"+(l1-l2)/1000/60/60/24+"天"); } }
3.请将当前日期按照"2018年4月3日 22点22分22秒"打印在控制台
package d02; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date; public class t03 { public static void main(String[] args) { // TODO Auto-generated method stub SimpleDateFormat sdf=new SimpleDateFormat("yyyy年MM月dd日 hh:mm:ss"); Calendar c=Calendar.getInstance(); Date d=new Date(); String curr=sdf.format(d); System.out.println(curr); } }
4.请将"2068年3月3日 15:07:04:"转成date类型打印在控制台
package d02; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; public class t04 { public static void main(String[] args) throws ParseException { SimpleDateFormat sdf=new SimpleDateFormat("yyyy年MM月dd日 hh:mm:ss"); Date d2=sdf.parse("2068年3月3日 15:07:04"); System.out.println(d2); } }
5.控制台输入一个人的生日,判断截至到当前日期他活了多少个月?
package d02; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; import java.util.Scanner; public class t05 { public static void main(String[] args) throws ParseException { Scanner sc=new Scanner(System.in); System.out.println("输入你的生日:yyyy-MM-dd "); String str=sc.next(); SimpleDateFormat sdf=new SimpleDateFormat("yyyy-MM-dd"); Date birthday=sdf.parse(str); Date birth=sdf.parse(str); Date now= new Date(); long time=now.getTime()-birth.getTime(); int time2= (int) (time/1000/60/60/24/30); System.out.println("你已经活了"+time2+"个月"); } }
正则表达式练习总结
1.对输入的qq号进行匹配(qq匹配规则:长度为5-10位,纯数字组成,且不能以0开头。)
package d01; import java.util.Scanner; public class t01 { public static void main(String[] args) { // TODO Auto-generated method stub Scanner sc=new Scanner(System.in); System.out.println("请输入qq号码:"); String str=sc.next(); String reg="^[1-9]\\d{4,10}$"; boolean b=str.matches(reg); System.out.println(b); } }
2.对输入的电话号码进行匹配(匹配要求:匹配成功的电话号码位数为11位的纯数字,且以1开头,第二位必须是:3、7、8中的一位,
即只匹配13*********、17*********、18*********的电话号码)。
package d01; import java.util.Scanner; public class t02 { public static void main(String[] args) { // TODO Auto-generated method stub Scanner sc=new Scanner(System.in); System.out.println("输入电话号码:"); String str=sc.next(); String reg="1[378][0-9]{9}"; boolean b=str.matches(reg); System.out.println(b); } }
3.对字符串“张三@@@李四@@王五@茅台”进行切割,去掉@符号。
package d01; public class t03 { public static void main(String[] args) { // TODO Auto-generated method stub String str="张三@@@李四@@王五@茅台"; String reg="@"; String arr[]=str.split(reg); System.out.println(str.replaceAll(reg,"")); } }
4.【以叠词切割】:如字符串"abccsasahhhz"按“叠词”来切割就变成了“ab”,“sasa”,“z”。因为“cc”、“hhh”都是叠词,
需要切割掉。现在请将字符串“张三@@@李四¥¥王五ssssssss江流儿”按照叠词切割。
提示:即使用括号:()来表示组,那么组是干嘛的?我们就可以 对组中的数据进行引用:那么regex = "(.)\\1"就表示:
某一字符出现了两次(注意首先我们用(.)来表示任意字符,而\\1是对组(.)中的字符进行复用,合起来就是:两个相同的字符),
现在我们不只是需要出现两次的字符,所以使用+号来表示出现多次,最终叠词就表示为:regex = "(.)\\1+"。
package d02; import java.text.ParseException; import java.text.SimpleDateFormat; import java.util.Date; public class t04 { public static void main(String[] args) throws ParseException { SimpleDateFormat sdf=new SimpleDateFormat("yyyy年MM月dd日 hh:mm:ss"); Date d2=sdf.parse("2068年3月3日 15:07:04"); System.out.println(d2); } }
5.将字符串“张三@@@李四YYY王五*****王尼玛”中的叠词替换为:“、”。
package d01; public class t05 { public static void main(String[] args) { // TODO Auto-generated method stub String str="张三@@@李四YYY王五*****王尼玛"; String regex = "(.)\\1+"; String arr[]=str.split(regex); System.out.println(str.replaceAll(regex, ",")); } }