神奇的match和replace
源自跟奈落大叔的讨论,PHP和JavaScript的比较。
正则:
先说几个正则写法:
() 选择匹配一组, (?:) 降低 () 的优先级, .*? 和 .+? ,阻止 . 和 + 的贪婪。
还有一些正则的高级写法:
(?=) 和 (?<=) ,零宽断言,以及 (?!) 和 (?<!) ,负向零宽,详见:百度百科(正则表达式)。
以及js里正则常用的方法:
reg.test(str) 检测reg是否匹配str中的内容,返回true或false。
match:
先来一个例子:
var url="http://www.cnblogs.com/rubylouvre/p/3181291.html#top22"; var a=url.match(/t/); // ["t"] // 找一个 console.log(a.index); // 1 // 找一个,带着它所在的位置(index) url.match(/t/g); // ["t", "t", "t", "t"] // 找一堆,不带index url.match(/(t)/); // ["t", "t"] // 带括号找一个,第一个是结果,第二个是括号里匹配到的内容 url.match(/(t)/i); // ["t", "t"] // 带括号加i,跟没加一样,没有特殊 url.match(/(t)/g); // ["t", "t", "t", "t"] // 带括号加g,只有结果 url.match(/(?:t)/); // ["t"] // 使用?:取消()的优先级,有index属性 url.match(/(?:t)/g); // ["t", "t", "t", "t"] // 加上g后依然返回一堆
上面几个,带上g标记,会得到所有匹配的内容,不带g则只会匹配到第一个结果(也是数组),而且这个数组多了index属性,表示匹配内容所在的位置。
而i标记不会影响结果个数,每出现一个 () 都会在匹配结果中增加一项,而改为 (?:) 后则不会增加。即使增加了,也是只匹配出一个结果,数组依然有index属性。
鼓捣了一下午,弄了个高端且粗糙的:
var url="http://www.cnblogs.com/rubylouvre/p/3181291.html#top22"; url.match(/(.*?):\/{2}(.*?)\/([^\?#]*(?=\/[^\/]*)[\/$])([^\?#]*)([\?#].*)?/); // ["http://www.cnblogs.com/rubylouvre/p/3181291.html#top22", "http", "www.cnblogs.com", "rubylouvre/p/", "3181291.html", "#top22"]
返回结果:[整个地址,协议名称,域名,文件路径,文件名,hash/search]。
写法有很多,这里只是想用一下 (?=) 方式,以我现在的水平,只要结果对就好。。
replace:
以前用replace,主要是像 str.replace(reg/str,str/function(s){return fn(s)}); 这样,现在要加上正则的用法:反向引用。
先来一个例子:
var str="abcdefg"; str.replace(/([abc])/g,"$&,"); // "a,b,c,defg" str.replace(/([abc])([bcd])/g,"$&,"); // "ab,cd,efg" str.replace(/([abc])([bcd])/g,"$1,$2;"); // "a,b;c,d;efg"
可以在后面的替换字符串里,用 $& 表示匹配出的结果,相当于match结果的第[0]个(其实PHP中就是用 &0 来表示的),用 &n 来表示第n个小括号里匹配出的内容,相当于match结果中的第[n]个。
出了这两个,还有 &` 表示匹配结果左侧的内容, &' 表示匹配结果右侧的内容, $$ 表示替换成一个$符。
收获:
正则里,还有js对正则的使用,都有很多东西值得挖掘。