正则匹配文本中的链接

  最近做的一个项目中遇到使用正则匹配一段文本中的 url 并将其显示为短连接的需求。

  显示的文本包括为防止 xss 而用 js 处理过的带有特殊符号的文本以及 php 直接渲染后的文本,所以需要两个正则表达式。

// 匹配不带特殊符号的文本的正则
var reg0 = /((((https?|ftp?):(?:\/\/)?)(?:[-;:&=\+\$]+@)?[A-Za-z0-9.-]+|(?:www.|[-;:&=\+\$]+@)[A-Za-z0-9.-]+)((?:\/[\+~%\/.\w-_]*)?\??(?:[-\?\+=&;:%!\/@.\w_]*)#?(?:[-\+=&;%!\?\/@.\w_]*))?)/ig;
// 匹配带有特殊符号的文本的正则
var reg1 = /((((https?|ftp?|http?):(?:(/)(/))?)(?:[-;:(&)=\+\$]+@)?[A-Za-z0-9.-]+|(?:www.|[-;:=\+\$]+@)[A-Za-z0-9.-]+)((?:(/)[\+~%(/).\w-_]*)?\??(?:[-\?\+=(&);:%!(/)@.\w_]*)#?(?:[-\?\+=(&);%!(/)@.\w_]*))?)/ig;
function replaceSrc(txt, type){
  // 将长连接处理为短链接
    var urlReg = /[a-zA-Z0-9][-a-zA-Z0-9]{0,62}(\.[a-zA-Z0-9][-a-zA-Z0-9]{0,62})+\.?/;
  
  // type 为 0 表示文本中不带有特殊符号

    if( type == '0' ){
        reg = reg0;
  // type 为 1 表示文本经js处理过,带有特殊符号
    }else if( type == '1' ){
        reg = reg1;
    }
    var result = txt.replace(reg,function(item){
        return "<a class='short_link' href='"+ item +"' target='_blank'>"+urlReg.exec(item)[0]+"</a>";
    });
    return result;
}
posted @ 2018-01-08 11:11  狂奔的蜗牛1031  阅读(2894)  评论(0编辑  收藏  举报