去重正则的解析

  正则表达式,对于初学者来说,确实是一个重磅炸弹,没办法,要想进阶。。必须啃掉它。

  

  借助博客园一哥们的例子,我们将详细讲述去重正则的用法:

  

function del(str){    
var reg = /(\w|\/)\1/;
while(reg.test(str)){
str = str.replace(reg, "$1");
}
return str;
}

alert(del("woshiii_______//////////asssdwkskkkkkaa"));

  这个就是传说中的去重正则。那么,要理解它,我们必须掌握以下几个基本概念:

  1、\w  它的意思就是匹配大小写字母、数字、下划线这几类字符,换种写法就是[a-zA-Z0-9_];

  2、转义符\,相信这个大家都清楚 所以\/就是匹配斜杠。

  3、分组(),在上面的例子中(\w|\/)就代表一个分组,分组所匹配到的字符串会被储存起来,随后可以用\1获取到,而在replace方法里,可以用$1取到,相应的 多个分组就是由\1....\9获取,同理$1...$9。

 

  OK,明确以上概念,我们就好理解了。

  首先看正则:reg = /(\w|\/)\1/; 第一个分组里匹配的就是概念1里所说的东西,或者匹配一个斜杠,那么,当对字符串进行匹配的时候,匹配了的结果就已经存储起来了,比如说匹配到 i 字母,那么\1指的就是匹配到的i字母。'

  所以,根据这个正则,第一个匹配到的就是 i i两个字母。于是,通过replace方法,我们会把匹配到的 i i两个字母替换成"$1"。

  $1是什么呢?根据概念3,就是第一个分组匹配的东西,在这也就是 i 所以,结果就是把字符串里的'ii'换成了'i',从而达到了去重的效果。

  当然了,这只替换了1个i,后面重复的字符就需要用while循环,通过test方法验证,如果存在重复字符就循环执行刚才的步骤。最后得到的就是想要的结果。

  不知道上面描述的够不够清楚,还望各位大大监督小弟修改文章里的错误。^^]

posted @ 2012-02-29 13:48  Krouky  阅读(2825)  评论(1编辑  收藏  举报