神奇的match和replace

源自跟奈落大叔的讨论,PHP和JavaScript的比较。

正则:

先说几个正则写法:

 () 选择匹配一组, (?:) 降低 () 的优先级, .*? 和 .+? ,阻止 . 和 + 的贪婪。

还有一些正则的高级写法:

 (?=) 和 (?<=) ,零宽断言,以及 (?!) 和 (?<!) ,负向零宽,详见:百度百科(正则表达式)

以及js里正则常用的方法:

 reg.test(str) 检测reg是否匹配str中的内容,返回true或false。

match:

先来一个例子:

var url="http://www.cnblogs.com/rubylouvre/p/3181291.html#top22";
var a=url.match(/t/);       // ["t"]                    // 找一个
console.log(a.index);       // 1                        // 找一个,带着它所在的位置(index)
url.match(/t/g);            // ["t", "t", "t", "t"]     // 找一堆,不带index
url.match(/(t)/);           // ["t", "t"]               // 带括号找一个,第一个是结果,第二个是括号里匹配到的内容
url.match(/(t)/i);          // ["t", "t"]               // 带括号加i,跟没加一样,没有特殊
url.match(/(t)/g);          // ["t", "t", "t", "t"]     // 带括号加g,只有结果
url.match(/(?:t)/);         // ["t"]                    // 使用?:取消()的优先级,有index属性
url.match(/(?:t)/g);        // ["t", "t", "t", "t"]     // 加上g后依然返回一堆

上面几个,带上g标记,会得到所有匹配的内容,不带g则只会匹配到第一个结果(也是数组),而且这个数组多了index属性,表示匹配内容所在的位置。

而i标记不会影响结果个数,每出现一个 () 都会在匹配结果中增加一项,而改为 (?:) 后则不会增加。即使增加了,也是只匹配出一个结果,数组依然有index属性。

鼓捣了一下午,弄了个高端且粗糙的:

var url="http://www.cnblogs.com/rubylouvre/p/3181291.html#top22";
url.match(/(.*?):\/{2}(.*?)\/([^\?#]*(?=\/[^\/]*)[\/$])([^\?#]*)([\?#].*)?/);
// ["http://www.cnblogs.com/rubylouvre/p/3181291.html#top22", "http", "www.cnblogs.com", "rubylouvre/p/", "3181291.html", "#top22"]

返回结果:[整个地址,协议名称,域名,文件路径,文件名,hash/search]。

写法有很多,这里只是想用一下 (?=) 方式,以我现在的水平,只要结果对就好。。

replace:

以前用replace,主要是像 str.replace(reg/str,str/function(s){return fn(s)}); 这样,现在要加上正则的用法:反向引用。

先来一个例子:

var str="abcdefg";
str.replace(/([abc])/g,"$&,");                // "a,b,c,defg"
str.replace(/([abc])([bcd])/g,"$&,");         // "ab,cd,efg"
str.replace(/([abc])([bcd])/g,"$1,$2;");      // "a,b;c,d;efg"

可以在后面的替换字符串里,用 $& 表示匹配出的结果,相当于match结果的第[0]个(其实PHP中就是用 &0 来表示的),用 &n 来表示第n个小括号里匹配出的内容,相当于match结果中的第[n]个。

出了这两个,还有 &` 表示匹配结果左侧的内容, &' 表示匹配结果右侧的内容, $$ 表示替换成一个$符。

收获:

正则里,还有js对正则的使用,都有很多东西值得挖掘。

 

posted @ 2014-08-07 18:33  ccforeverd  阅读(222)  评论(0编辑  收藏  举报