2018年4月3日JAVA正则表达式

正则表达式

1匹配验证-验证Email是否正确

public static void main(String[] args) {
    // 要验证的字符串
    String str = "service@xsoftlab.net";
    // 邮箱验证规则
    String regEx = "[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\\.){1,3}[a-zA-z\\-]{1,}";
    // 编译正则表达式
    Pattern pattern = Pattern.compile(regEx);
    // 忽略大小写的写法
    // Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
    Matcher matcher = pattern.matcher(str);
    // 字符串是否与正则表达式相匹配
    boolean rs = matcher.matches();
    System.out.println(rs);
}

 

 

2在字符串中查询字符或者字符串

public static void main(String[] args) {
    // 要验证的字符串
    String str = "baike.xsoftlab.net";
    // 正则表达式规则
    String regEx = "baike.*";
    // 编译正则表达式
    Pattern pattern = Pattern.compile(regEx);
    // 忽略大小写的写法
    // Pattern pat = Pattern.compile(regEx, Pattern.CASE_INSENSITIVE);
    Matcher matcher = pattern.matcher(str);
    // 查找字符串中是否有匹配正则表达式的字符/字符串
    boolean rs = matcher.find();
    System.out.println(rs);
}

3常用正则表达式

规则 正则表达式语法 
一个或多个汉字    ^[\u0391-\uFFE5]+$ 
邮政编码    ^[1-9]\d{5}$
QQ号码    ^[1-9]\d{4,10}$ 
邮箱    ^[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0-9]-*){1,}\.){1,3}[a-zA-z\-]{1,}$ 
用户名(字母开头 + 数字/字母/下划线)    ^[A-Za-z][A-Za-z1-9_-]+$
手机号码    ^1[3|4|5|8][0-9]\d{8}$ 
URL    ^((http|https)://)?([\w-]+\.)+[\w-]+(/[\w-./?%&=]*)?$ 
18位身份证号    ^(\d{6})(18|19|20)?(\d{2})([01]\d)([0123]\d)(\d{3})(\d|X|x)?$

4正则表达式语法

元字符

描述

\

将下一个字符标记符、或一个向后引用、或一个八进制转义符。例如,“\\n”匹配\n。“\n”匹配换行符。序列“\\”匹配“\”而“\(”则匹配“(”。即相当于多种编程语言中都有的“转义字符”的概念。

^

匹配输入字符串的开始位置。如果设置了RegExp对象的Multiline属性,^也匹配“\n”或“\r”之后的位置。

$

匹配输入字符串的结束位置。如果设置了RegExp对象的Multiline属性,$也匹配“\n”或“\r”之前的位置。

*

匹配前面的子表达式任意次。例如,zo*能匹配“z”,“zo”以及“zoo”。*等价于{0,}。

+

匹配前面的子表达式一次或多次(大于等于1次)。例如,“zo+”能匹配“zo”以及“zoo”,但不能匹配“z”。+等价于{1,}。

?

匹配前面的子表达式零次或一次。例如,“do(es)?”可以匹配“do”或“does”中的“do”。?等价于{0,1}。

{n}

n是一个非负整数。匹配确定的n次。例如,“o{2}”不能匹配“Bob”中的“o”,但是能匹配“food”中的两个o。

{n,}

n是一个非负整数。至少匹配n次。例如,“o{2,}”不能匹配“Bob”中的“o”,但能匹配“foooood”中的所有o。“o{1,}”等价于“o+”。“o{0,}”则等价于“o*”。

{n,m}

m和n均为非负整数,其中n<=m。最少匹配n次且最多匹配m次。例如,“o{1,3}”将匹配“fooooood”中的前三个o。“o{0,1}”等价于“o?”。请注意在逗号和两个数之间不能有空格。

?

当该字符紧跟在任何一个其他限制符(*,+,?,{n},{n,},{n,m})后面时,匹配模式是非贪婪的。非贪婪模式尽可能少的匹配所搜索的字符串,而默认的贪婪模式则尽可能多的匹配所搜索的字符串。例如,对于字符串“oooo”,“o+?”将匹配单个“o”,而“o+”将匹配所有“o”。

.点

匹配除“\r\n”之外的任何单个字符。要匹配包括“\r\n”在内的任何字符,请使用像“[\s\S]”的模式。

(pattern)

匹配pattern并获取这一匹配。所获取的匹配可以从产生的Matches集合得到,在VBScript中使用SubMatches集合,在JScript中则使用$0…$9属性。要匹配圆括号字符,请使用“\(”或“\)”。

(?:pattern)

匹配pattern但不获取匹配结果,也就是说这是一个非获取匹配,不进行存储供以后使用。这在使用或字符“(|)”来组合一个模式的各个部分是很有用。例如“industr(?:y|ies)”就是一个比“industry|industries”更简略的表达式。

(?=pattern)

正向肯定预查,在任何匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如,“Windows(?=95|98|NT|2000)”能匹配“Windows2000”中的“Windows”,但不能匹配“Windows3.1”中的“Windows”。预查不消耗字符,也就是说,在一个匹配发生后,在最后一次匹配之后立即开始下一次匹配的搜索,而不是从包含预查的字符之后开始。

(?!pattern)

正向否定预查,在任何不匹配pattern的字符串开始处匹配查找字符串。这是一个非获取匹配,也就是说,该匹配不需要获取供以后使用。例如“Windows(?!95|98|NT|2000)”能匹配“Windows3.1”中的“Windows”,但不能匹配“Windows2000”中的“Windows”。

(?<=pattern)

反向肯定预查,与正向肯定预查类似,只是方向相反。例如,“(?<=95|98|NT|2000)Windows”能匹配“2000Windows”中的“Windows”,但不能匹配“3.1Windows”中的“Windows”。

(?<!pattern)

反向否定预查,与正向否定预查类似,只是方向相反。例如“(?<!95|98|NT|2000)Windows”能匹配“3.1Windows”中的“Windows”,但不能匹配“2000Windows”中的“Windows”。

x|y

匹配x或y。例如,“z|food”能匹配“z”或“food”或"zood"(此处请谨慎)。“(z|f)ood”则匹配“zood”或“food”。

[xyz]

字符集合。匹配所包含的任意一个字符。例如,“[abc]”可以匹配“plain”中的“a”。

[^xyz]

负值字符集合。匹配未包含的任意字符。例如,“[^abc]”可以匹配“plain”中的“plin”。

[a-z]

字符范围。匹配指定范围内的任意字符。例如,“[a-z]”可以匹配“a”到“z”范围内的任意小写字母字符。

注意:只有连字符在字符组内部时,并且出现在两个字符之间时,才能表示字符的范围; 如果出字符组的开头,则只能表示连字符本身.

[^a-z]

负值字符范围。匹配任何不在指定范围内的任意字符。例如,“[^a-z]”可以匹配任何不在“a”到“z”范围内的任意字符。

\b

匹配一个单词边界,也就是指单词和空格间的位置(即正则表达式的“匹配”有两种概念,一种是匹配字符,一种是匹配位置,这里的\b就是匹配位置的)。例如,“er\b”可以匹配“never”中的“er”,但不能匹配“verb”中的“er”。

\B

匹配非单词边界。“er\B”能匹配“verb”中的“er”,但不能匹配“never”中的“er”。

\cx

匹配由x指明的控制字符。例如,\cM匹配一个Control-M或回车符。x的值必须为A-Z或a-z之一。否则,将c视为一个原义的“c”字符。

\d

匹配一个数字字符。等价于[0-9]。

\D

匹配一个非数字字符。等价于[^0-9]。

\f

匹配一个换页符。等价于\x0c和\cL。

\n

匹配一个换行符。等价于\x0a和\cJ。

\r

匹配一个回车符。等价于\x0d和\cM。

\s

匹配任何不可见字符,包括空格、制表符、换页符等等。等价于[ \f\n\r\t\v]。

\S

匹配任何可见字符。等价于[^ \f\n\r\t\v]。

\t

匹配一个制表符。等价于\x09和\cI。

\v

匹配一个垂直制表符。等价于\x0b和\cK。

\w

匹配包括下划线的任何单词字符。类似但不等价于“[A-Za-z0-9_]”,这里的"单词"字符使用Unicode字符集。

\W

匹配任何非单词字符。等价于“[^A-Za-z0-9_]”。

\xn

匹配n,其中n为十六进制转义值。十六进制转义值必须为确定的两个数字长。例如,“\x41”匹配“A”。“\x041”则等价于“\x04&1”。正则表达式中可以使用ASCII编码。

\num

匹配num,其中num是一个正整数。对所获取的匹配的引用。例如,“(.)\1”匹配两个连续的相同字符。

\n

标识一个八进制转义值或一个向后引用。如果\n之前至少n个获取的子表达式,则n为向后引用。否则,如果n为八进制数字(0-7),则n为一个八进制转义值。

\nm

标识一个八进制转义值或一个向后引用。如果\nm之前至少有nm个获得子表达式,则nm为向后引用。如果\nm之前至少有n个获取,则n为一个后跟文字m的向后引用。如果前面的条件都不满足,若n和m均为八进制数字(0-7),则\nm将匹配八进制转义值nm。

\nml

如果n为八进制数字(0-7),且m和l均为八进制数字(0-7),则匹配八进制转义值nml。

\un

匹配n,其中n是一个用四个十六进制数字表示的Unicode字符。例如,\u00A9匹配版权符号(&copy;)。

\< \> 匹配词(word)的开始(\<)和结束(\>)。例如正则表达式\<the\>能够匹配字符串"for the wise"中的"the",但是不能匹配字符串"otherwise"中的"the"。注意:这个元字符不是所有的软件都支持的。
\( \) 将 \( 和 \) 之间的表达式定义为“组”(group),并且将匹配这个表达式的字符保存到一个临时区域(一个正则表达式中最多可以保存9个),它们可以用 \1 到\9 的符号来引用。
| 将两个匹配条件进行逻辑“或”(Or)运算。例如正则表达式(him|her) 匹配"it belongs to him"和"it belongs to her",但是不能匹配"it belongs to them."。注意:这个元字符不是所有的软件都支持的。
+ 匹配1或多个正好在它之前的那个字符。例如正则表达式9+匹配9、99、999等。注意:这个元字符不是所有的软件都支持的。
? 匹配0或1个正好在它之前的那个字符。注意:这个元字符不是所有的软件都支持的。
{i} {i,j} 匹配指定数目的字符,这些字符是在它之前的表达式定义的。例如正则表达式A[0-9]{3} 能够匹配字符"A"后面跟着正好3个数字字符的串,例如A123、A348等,但是不匹配A1234。而正则表达式[0-9]{4,6} 匹配连续的任意4个、5个或者6个数字

DATE类

一:Date类

  1.使用Date类代表当前系统时间

 Date date = new Date(); System.out.println(date);

  使用Date类的默认构造方法创建出来的对象就代表当前的时间,由于Date类覆盖了toString()方法。所以可以直接输出Date类型的对象,显示的结果如下:

  Sun Aug 28 10:23:06 CST 2016

  在该格式中,Sun代表Sunday(周日),Aug 代表August(八月),28代表288号,CST代表China Standard Time(中国标准时间,也就是北京时间(东八区))。

  2.使用Date类代表指定时间

Date date = new Date(2016-1900,8-1,28); System.out.println(date);

  使用带参的构造方法,可以构造指定日期的Date类对象,Date类中年份的参数应该是实际需要代表的年份减去1900,实际需要代表的月份减去1以后的值。显示结果如下:

  Sun Aug 28 00:00:00 CST 2016  代表的日期就是2016年8月28号

  实际代表的年月日时分秒的日期对象和这个类似。

  3.获取Date对象中的信息

  

 

  使用Date类中的get方法,可以获得Date类对象的相关信息(但可以看出,Date类中的这些方法都已经过时)。需要注意的是使用getYear获得的是Date对象中年份减去1900以后的值,所以需要显示对应的年份则需要在返回值的基础上加1900,月份类似。在Date类中还提供了getDay方法,用于获得Date对象代表的时间是星期几,Date类规定周日是0,周一是1,周二是2,后续的依次类推。

  4.Date对象和相对时间的互转

Date date = new Date(2016-1900,8-1,28);  long time = 1290876532190L;
  //将Date类的对象转换为相对时间

  long t = date.getTime(); System.out.println(t);  //结果是:1472313600000

  //将相对时间转换为Date类的对象

  Date da = new (time); System.out.println(da);  //结果是:Sun Aug 28 00:00:00 CST 2016 

  5.Date对象之间的比较

 Date date = new Date(2016-1900,8-1,28);

  Date date1 = new Date();

  date.compareTo(date1)返回int类型。如果等于0,则date=date1;如果小于0,则date<date1;

 

  使用Date对象中的getTime方法,可以将Date类的对象转换为相对时间,使用Date类的构造方法,可以将相对时间转换为Date类的对象。经过转换以后,既方便了时间的计算,也使时间显示比较直观了。

  二:Calendar类

  从JDK1.1版本开始,在处理日期和时间时,系统推荐使用Calendar类进行实现(Date的一些方法都过时了)。在设计上,Calendar类的功能要比Date类强大很多,而且在实现方式上也比Date类要复杂一些,下面就介绍一下Calendar类的使用。

  Calender类是一个抽象类,在实际使用时实现特定的子类的对象,创建对象的过程对程序员来说是透明的,只需要使用getInstance()方法创建即可。

  1.使用Calendar类代表当前时间

 Calendar c = Calendar.getInstance(); System.out.println(c);  //返回的是一个Calendar对象

  由于Calendar类是抽象类,且Calendar类的构造方法是protected的,所以无法使用Calendar类的构造方法来创建对象,API中提供了getInstance方法用来创建对象。使用该方法获得的Calendar对象就代表当前的系统时间,由于Calendar类toString实现的没有Date类那么直观,所以直接输出Calendar类的对象意义不大。

  2.使用Calendar类代表指定的时间

Calendar c1 = Calendar.getInstance();

  c1.set(2016,8-1,28);

  使用过Calendar类代表特定的时间,需要首先创建一个Calendar的对象,然后在设定该对象中的年月日参数来完成。

  set方法的声明为:public final void set(int year,int month,int date)

  以上示例代码设置的时间为2016年8月28日,其参数的结构和Date类不一样。Calendar类中年份的数值直接书写,月份的值为实际的月份值减1,日期的值就是实际的日期值。

  如果只设定某个字段某个字段,例如日期的值,则可以使用如下set方法:

  public void set(int field,int value)

  在该方法中,参数field代表要设置的字段的类型,常见类型如下:

  Calendar.YEAR---年份;Calendar.MONTH---月份; Calendar.DATE---日期; Calendar.DAY_OF_MONTH---日期,和Calendar.DATE字段完全相同;

  Calendar.HOUR---12小时制的小时数;Calendar.HOUR_OF_DAY---24小时制的小时数;Calendar.MINUTE---分钟;Calendar.SECOND---秒;Calendar.DAY_OF_WEEK---星期几。

  后续的参数value代表设置成的值。例如:c1.set(Calendar.DATE,10);该代码的作用是将c1对象代表的时间中日期设置为10号,其它所有的数值会被重新计算,例如星期几以及对应的相对时间数值等。

  3.获得Calendar类中的信息

  

  在Calendar类中,周日是1,周一是2,周二是3,依次类推。

  4.其他方法说明

  其实Calendar类中还提供了很多其他有用的方法,下面简单的介绍几个常见方法的使用。

    (1)add方法

  public abstract void add(int field,int amount)

    该方法的作用是在Calendar对象中的某个字段上增加或减少一定的数值,增加是amount的值为正,减少是amount的值为负。

    例如计算当前时间100天以后的日期,代码如下:

 Calendar c3 = Calendar.getInstance();

    c3.add(Calendar.DATE,100);

    int year = c3.get(Calendar.YEAR); 

    int month = c3.get(Calendar.MONTH);

    int date  = c3.get(Calendar.DATE);

    System.out.println(year+"年"+month+"月"+date+"日"); 

    这里add方法是指在c3对象的Calendar.DATE,也就是日期字段上增加100,类内部会重新计算该日期对象中其它各字段的值,从而获得100天以后的   日期,例如程序的输出结果可能为:2016年11月6日

    (2)after方法

 public boolean after(Object when)

    该方法的作用是判断当前日期对象是否在when对象的后面,如果在when对象的后面则返回true,否则返回false。例如:

    Calebdar c4 = Calendar.getInstance(); c4.set(2016,8-1,28);

    Calendar c5 = Calendar.getInstance();c5.set(2016,10-1,1);

    boolean b = c5.after(c4);

    System.out.println(b);   

    在该示例代码中对象c4代表的时间是2016年8月28号,对象c5代表的时间是2016年10月1号,则对象c5代表的日期在c4代表的日期之后,所以after   方法的返回值是true。

    另外一个类似的方法是before,该方法是判断当前日期对象是否位于另外一个日期对象之前。

  5.Calendar对象和相对时间之间的转换

  

Calendar c6 = Calendar.getInstance();  long t = 1252785271098L;

  //将Calendar对象转换为相对时间

  long t1 = c6.getTimeInMillis();

  //将相对时间转换成Calendar对象

  Calendar c9 = Calendar.getInstance();

  c9.setTimeInMillis(t1);

  在转换时,使用Calendar类中的getTimeInMillis方法可以将Calendar对象转换为相对时间。在将相对时间转换为Calendar对象时,首先创建一个Calendar对象,然后再使用Calendar类的setTimeInMillis方法设置时间即可。

 

  1计算两个日期之间相差的天数

  例如计算2016年8月20号和2016年8月29号之间相差的天数。该程序实现的原理为:首先代表两个特定的时间点,这里使用Calendar的对象进行代表,然后将两个时间点转换为对应的相对时间,求两个时间点相对时间的差值,然后除以一天的毫秒数(24小时*60分钟*60秒*1000毫秒)即可获得对应的天数。实现该示例的完整代码如下:

  

  5.2输出当月的日历

  该示例的功能是输出当前系统时间所在月的日历,例如当前系统时间是2016年8月29日,则输出2016年8月的日历。

  该程序实现的原理为:首先获得该月1号是星期几,然后获得该月的天数,最后使用流程控制实现按照日历的格式进行输出即可。即如果1号是星期一,则打印一个单位的空格,如果1号是星期二,则打印两个单位的空格,依次类推。打印完星期六的日期以后,进行换行。实现该示例的完整代码如下:

  

作业练习总结:

1.如何获取当前的月份? 

package d02;
import java.util.Calendar;
import java.util.Date;

public class t01 {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
        Calendar c=Calendar.getInstance();
        int m=c.get(Calendar.MONTH)+1;
        System.out.println(m+"月");

    }

}

2.如何知道现在距离指定的时间还有多久?

package d02;

import java.util.Calendar;

public class t02 {

    public static void main(String[] args) {
        
        Calendar c=Calendar.getInstance();
        Calendar c2=Calendar.getInstance();
        c.set(Calendar.YEAR, 2019);
        c.set(Calendar.MONTH, 10);
        c.set(Calendar.DATE, 1);
        long l1=c.getTimeInMillis();
        long l2=c2.getTimeInMillis();
        System.out.println("距离当前时间还有:"+(l1-l2)/1000/60/60/24+"天");
    }

}


3.请将当前日期按照"2018年4月3日 22点22分22秒"打印在控制台

package d02;

import java.text.SimpleDateFormat;
import java.util.Calendar;
import java.util.Date;

public class t03 {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
SimpleDateFormat sdf=new SimpleDateFormat("yyyy年MM月dd日 hh:mm:ss");
    Calendar c=Calendar.getInstance();
     Date d=new Date();
      String curr=sdf.format(d);
      System.out.println(curr);
    }

}

4.请将"2068年3月3日 15:07:04:"转成date类型打印在控制台

package d02;

import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;

public class t04 {

    public static void main(String[] args) throws ParseException {
        SimpleDateFormat sdf=new SimpleDateFormat("yyyy年MM月dd日 hh:mm:ss");
        Date d2=sdf.parse("2068年3月3日 15:07:04");
        System.out.println(d2);
    }

}

5.控制台输入一个人的生日,判断截至到当前日期他活了多少个月?

package d02;
import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;
import java.util.Scanner;

public class t05 {

    public static void main(String[] args) throws ParseException {
        Scanner sc=new Scanner(System.in);
        System.out.println("输入你的生日:yyyy-MM-dd ");
        String str=sc.next();
        SimpleDateFormat sdf=new SimpleDateFormat("yyyy-MM-dd");
        Date birthday=sdf.parse(str);
        Date birth=sdf.parse(str);
        Date now= new Date();
        long time=now.getTime()-birth.getTime();
        int time2= (int) (time/1000/60/60/24/30);
        System.out.println("你已经活了"+time2+"个月");
    }

}

 正则表达式练习总结

1.对输入的qq号进行匹配(qq匹配规则:长度为5-10位,纯数字组成,且不能以0开头。)

package d01;
import java.util.Scanner;

public class t01 {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
Scanner sc=new Scanner(System.in);
System.out.println("请输入qq号码:");
String str=sc.next();
String reg="^[1-9]\\d{4,10}$";
boolean b=str.matches(reg);
System.out.println(b);
    }

}


2.对输入的电话号码进行匹配(匹配要求:匹配成功的电话号码位数为11位的纯数字,且以1开头,第二位必须是:3、7、8中的一位,
即只匹配13*********、17*********、18*********的电话号码)。

package d01;
import java.util.Scanner;

public class t02 {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
Scanner sc=new Scanner(System.in);
System.out.println("输入电话号码:");
String str=sc.next();
String reg="1[378][0-9]{9}";
boolean b=str.matches(reg);
System.out.println(b);
    }

}

3.对字符串“张三@@@李四@@王五@茅台”进行切割,去掉@符号。

package d01;

public class t03 {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
String str="张三@@@李四@@王五@茅台";
String reg="@";
String arr[]=str.split(reg);
System.out.println(str.replaceAll(reg,""));
    }

}

4.【以叠词切割】:如字符串"abccsasahhhz"按“叠词”来切割就变成了“ab”,“sasa”,“z”。因为“cc”、“hhh”都是叠词,
需要切割掉。现在请将字符串“张三@@@李四¥¥王五ssssssss江流儿”按照叠词切割。

提示:即使用括号:()来表示组,那么组是干嘛的?我们就可以 对组中的数据进行引用:那么regex = "(.)\\1"就表示:
某一字符出现了两次(注意首先我们用(.)来表示任意字符,而\\1是对组(.)中的字符进行复用,合起来就是:两个相同的字符),
现在我们不只是需要出现两次的字符,所以使用+号来表示出现多次,最终叠词就表示为:regex = "(.)\\1+"。

package d02;

import java.text.ParseException;
import java.text.SimpleDateFormat;
import java.util.Date;

public class t04 {

    public static void main(String[] args) throws ParseException {
        SimpleDateFormat sdf=new SimpleDateFormat("yyyy年MM月dd日 hh:mm:ss");
        Date d2=sdf.parse("2068年3月3日 15:07:04");
        System.out.println(d2);
    }

}

5.将字符串“张三@@@李四YYY王五*****王尼玛”中的叠词替换为:“、”。

package d01;

public class t05 {

    public static void main(String[] args) {
        // TODO Auto-generated method stub
    String str="张三@@@李四YYY王五*****王尼玛";
    String regex = "(.)\\1+";
    String arr[]=str.split(regex);
    System.out.println(str.replaceAll(regex, ","));
        
    }

}

 

posted on 2018-04-03 20:00  jason111  阅读(257)  评论(0编辑  收藏  举报

导航