去重正则的解析
正则表达式,对于初学者来说,确实是一个重磅炸弹,没办法,要想进阶。。必须啃掉它。
借助博客园一哥们的例子,我们将详细讲述去重正则的用法:
function del(str){
var reg = /(\w|\/)\1/;
while(reg.test(str)){
str = str.replace(reg, "$1");
}
return str;
}
alert(del("woshiii_______//////////asssdwkskkkkkaa"));
这个就是传说中的去重正则。那么,要理解它,我们必须掌握以下几个基本概念:
1、\w 它的意思就是匹配大小写字母、数字、下划线这几类字符,换种写法就是[a-zA-Z0-9_];
2、转义符\,相信这个大家都清楚 所以\/就是匹配斜杠。
3、分组(),在上面的例子中(\w|\/)就代表一个分组,分组所匹配到的字符串会被储存起来,随后可以用\1获取到,而在replace方法里,可以用$1取到,相应的 多个分组就是由\1....\9获取,同理$1...$9。
OK,明确以上概念,我们就好理解了。
首先看正则:reg = /(\w|\/)\1/; 第一个分组里匹配的就是概念1里所说的东西,或者匹配一个斜杠,那么,当对字符串进行匹配的时候,匹配了的结果就已经存储起来了,比如说匹配到 i 字母,那么\1指的就是匹配到的i字母。'
所以,根据这个正则,第一个匹配到的就是 i i两个字母。于是,通过replace方法,我们会把匹配到的 i i两个字母替换成"$1"。
$1是什么呢?根据概念3,就是第一个分组匹配的东西,在这也就是 i 所以,结果就是把字符串里的'ii'换成了'i',从而达到了去重的效果。
当然了,这只替换了1个i,后面重复的字符就需要用while循环,通过test方法验证,如果存在重复字符就循环执行刚才的步骤。最后得到的就是想要的结果。
不知道上面描述的够不够清楚,还望各位大大监督小弟修改文章里的错误。^^]