javaee正则表达式基础和常用表达式

正则基础:

字符集

[ ] : 代表单个字符。

[^] : 除了该字符外的所有单个字符。

[a-zA-Z] : [a-z] || [A-Z]。

[a-d[m-p]] ：[a, d] || [m, p] 并集关系。

[a-z&&[def]] ：交集 {“d”, “e”, “f”}。

[a-z&&[^bc]] ：a-z && [^bc]，a-z 除去 bc。

[a-z&&[^m-p]] ：a-z 中除了 m-p。

预定义字符集

. ：任意字符。

\d ：[0-9] 单个数字字符。

\d 代表转义字符，如果想表示 \d 的话，需要 \d。

\D ：[^0-9] 除了数字外的单个字符。

\s ：[\t\n\x0B\f\r] 空白字符。

\S ：[^\s] 非空白字符。

\w ：[a-zA-Z_0-9] 单词字符。

下划线也属于单词字符。

\W ：[^\w] 非单词字符。

数量词

X? ：出现 1 次或 1 次也没有（不能出现其他）。

X* ：出现 0 次或更多次。

X+ ：出现 1 次或多次，不包括 0 次。

X{n} ：出现恰好 n 次。

X{n,} ：出现至少 n 次。

X{n,m} ：出现 [n, m] 次，包含 n 也包含 m。

分割功能

public String[] split(String regex)

概述：字符串分割方法，将给定字符串中，两端都符合正则表达式的字符串拆分出来。特别的，这个匹配的字符串不会出现在返回的字符数组中。

案例：我们有一个已知的字符串，其中包含了多个名字，并且每个名字中间都用 , 分隔，我们想要获取每个名字，此时可以借助正则表达式来完成。

String str = "Sawyer,Jerry,Tom";
String[] arr_str = str.split("\\\,”);
System.out.println(Arrays.toString(arr_str));
//这里的正则表达式需要写成 \\\, ，表示是正则表达式的 \\,如果写成 \\, 则代表的是字符中的转义字符。

替换功能

public String replaceAll(String regex, String replacement)

正则表达式替换功能。

String str1 = “I123 Love432 Sa324wyer!”;    // 去掉数字
// 任意数字，使用 + 可以匹配多位数字，减少 replace 次数，提高性能。
String reget = “\\d+”;
String str2 = str1.replaceAll(reget, “”);
System.out.println(str2);

这里我们借助 String 中的另一个方法 replaceAll() 方法将字符串中的所有数字替换为空字符串。特别的，这里的正则表达式中使用了 + 来匹配出现 1 次或多次的数字，也就是将一组连续的数字一次替换掉，而不需要每次只替换掉一个数字，提高性能。

java正则表达式相关类

1) Pattern : 生成相关正则表达式规则引擎

2）Matcher : 正则表达式解析引擎

看下Pattern、Mather的使用

结果：

【商家】

【时间】

【金额】

【URL】

Matcher 的构造函数是私有，只能通过 Pattern.matcher获取对象。

Mathcer 主要有matches、 find、lookingAt

matches 方法 需要匹配到所有字符串才返回true、否则返回false


private static void testMatches() {
        String regex = "\\d+";
        
        System.out.println(Pattern.matches(regex, "123")); // true
        System.out.println(Pattern.matches(regex, "123abc123"));//false
        System.out.println(Pattern.matches(regex, "123abc"));//false
        
    }

lookingAt 方法 匹配最前面的字符串，匹配到的字符串的位置必须在最前面，才返回true、否则返回false

    private static void testLookingAt() {
        String str = "123aa";
        String regex = "\\d+";
        
        Pattern p = Pattern.compile(regex);
        Matcher m = p.matcher(str);
        
        System.out.println(m.lookingAt());//true
        
        str = "aa123";
        m = p.matcher(str);
        System.out.println(m.lookingAt());//false
    }

find 方法 匹配到字符串可以在任意位置，如果匹配到了返回true、否则返回false

    private static void testFind() {
        String str = "123aa";
        String regex = "\\d+";
        
        Pattern p = Pattern.compile(regex);
        Matcher m = p.matcher(str);
        
        System.out.println(m.find());//true
        
        str = "aa123";
        m = p.matcher(str);
        System.out.println(m.find());//true
        
        str = "aa";
        m = p.matcher(str);
        System.out.println(m.find());//false
    }

常用表达式:

1、校验密码强度

　　●密码的强度必须包含大小写字母和数字的组合，不能使用特殊字符，长度在8-16之间

^(?=.*\\d)(?=.*[a-z])(?=.*[A-Z]).{8,16}$

2、校验中文

　　●字符串只能是中文

^[\\u4e00-\\u9fa5]{0,}$

3、由数字，26个英文字母或下划线组成的字符串

^\\w+$

4、校验E-Mail 地址

[\\w!#%&'*+/=?^_`{|}~-]+)*@(?:[\\w](?:[\\w-]*[\\w])?\\.)+[\\w](?:[\\w-]*[\\w])?

5、校验身份证号码

　　●15位：

^[1-9]\\d{7}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}$

　　●18位 :

^[1-9]\\d{5}[1-9]\\d{3}((0\\d)|(1[0-2]))(([0|1|2]\\d)|3[0-1])\\d{3}([0-9]|X)$

6.校验日期

　　●“yyyy-mm-dd“ 格式的日期校验，已考虑平闰年

^(?:(?!0000)[0-9]{4}-(?:(?:0[1-9]|1[0-2])-(?:0[1-9]|1[0-9]|2[0-8])|(?:0[13-9]|1[0-2])-(?:29|30)|(?:0[13578]|1[02])-31)|(?:[0-9]{2}(?:0[48]|[2468][048]|[13579][26])|(?:0[48]|[2468][048]|[13579][26])00)-02-29)$

7、校验金额

　　●金额校验，精确到2位小数

^[0-9]+(.[0-9]{2})?$

8、校验手机号

　　●下面是国内 13、15、18开头的手机号正则表达式

^(13[0-9]|14[5|7]|15[0|1|2|3|5|6|7|8|9]|18[0|1|2|3|5|6|7|8|9])\\d{8}$

9、判断IE的版本

^.*MSIE [5-8](?:\\.[0-9]+)?(?!.*Trident\\/[5-9]\\.0).*$

10、校验IP-v4地址

\\b(?:(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\.){3}(?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)\\b

11、校验IP-v6地址

(([0-9a-fA-F]{1,4}:){7,7}[0-9a-fA-F]{1,4}|([0-9a-fA-F]{1,4}:)
{1,7}:|([0-9a-fA-F]{1,4}:){1,6}:[0-9a-fA-F]
{1,4}|([0-9a-fA-F]{1,4}:){1,5}(:[0-9a-fA-F]{1,4})
{1,2}|([0-9a-fA-F]{1,4}:){1,4}(:[0-9a-fA-F]{1,4})
{1,3}|([0-9a-fA-F]{1,4}:){1,3}(:[0-9a-fA-F]{1,4})
{1,4}|([0-9a-fA-F]{1,4}:){1,2}(:[0-9a-fA-F]{1,4})
{1,5}|[0-9a-fA-F]{1,4}:((:[0-9a-fA-F]{1,4})
{1,6})|:((:[0-9a-fA-F]{1,4}){1,7}|:)|fe80:(:[0-9a-fA-F]{0,4})
{0,4}%[0-9a-zA-Z]{1,}|::(ffff(:0{1,4}){0,1}:)
{0,1}((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.)
{3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])|([0-9a-fA-F]{1,4}:)
{1,4}:((25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9])\\.)
{3,3}(25[0-5]|(2[0-4]|1{0,1}[0-9]){0,1}[0-9]))

12、检查URL的前缀

if (!s.match(/^[a-zA-Z]+:\\/\\//)){   s = 'http://' + s;}

13、提取URL链接

^(f|ht){1}(tp|tps):\\/\\/([\\w-]+\\.)+[\\w-]+(\\/[\\w- ./?%&=]*)?

14、文件路径及扩展名校验

^([a-zA-Z]\\:|\\\\)\\\\([^\\\\]+\\\\)*[^\\/:*?"<>|]+\\.txt(l)?$

15、提取Color Hex Codes

^#([A-Fa-f0-9]{6}|[A-Fa-f0-9]{3})$

16、提取网页图片

\\< *[img][^\\\\>]*[src] *= *[\\"\\']{0,1}([^\\"\\'\\ >]*)

17、提取页面超链接

(<a\\s*(?!.*\\brel=)[^>]*)(href="https?:\\/\\/)((?!(?:(?:www\\.)?'.implode('|(?:www\\.)?', $follow_list).'))[^"]+)"((?!.*\\brel=)[^>]*)(?:[^>]*)>

posted @ 2019-04-15 17:12 崇州周柏豪阅读(229) 评论(0) 编辑收藏举报

刷新页面返回顶部

崇州周柏豪