正则表达式匹配域名

我们知道通过正则表达式可以实现对字符的匹配,正好项目中有个需要去掉图片url的域名部分,比如:http://xxx.yyy.cn/aa/bb.jpg,去掉后为aa/bb.jpg。这个用正则表达式可以轻松实现。

表达式如下:

^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9\-]{0,61}[a-zA-Z0-9])?\.)+[a-zA-Z]{2,6}(/)

该表达式可以匹配以http://或者https://开头且支持域名中有中划线的情况,并且会匹配到域名后的第一个/.

也就是我们开题说的替换完的结果就是 aa/bb.jpg。

简要说明:

()中表示一个子表达式,

| 或关系,比如这里匹配http://或https://

? 表示匹配 0 次或一次。 也就是如果要匹配 xxx.yyy.cn/aa/bb.jpg 这个链接匹配的结果也是 aa/bb.jpg

{n,m}限定表达式,最少n次,最大m次。n<=m

java处理:

public static void main(String[] args) {
        String pattern = "^((http://)|(https://))?([a-zA-Z0-9]([a-zA-Z0-9\\-]{0,61}[a-zA-Z0-9])?\\.)+[a-zA-Z]{2,6}(/)";
        Pattern p = Pattern.compile(pattern);
        String line = "https://xxx.yyy.cn/aa/bb.jpg";
        Matcher m = p.matcher(line);

        if(m.find()){
            //匹配结果
            System.out.println("=" + m.group());
        }
        //替换
        System.out.println(line.replaceAll(pattern, ""));
    }

 参考:http://www.cnblogs.com/LCX/archive/2008/07/16/1244481.html

  http://www.runoob.com/regexp/regexp-syntax.html

posted @ 2016-11-11 19:19  blacksonny  阅读(78070)  评论(0编辑  收藏  举报