js中几个正则表达式相关函数使用时g标志的作用
首先,javascript中涉及到正则表达式的函数总共有6个,可分为两种:
1、第一种是作为字符串对象的方法,即以
String.fun();
形式调用,这里包括 split、search、match、replace 这四个函数。
2、第二种是作为正则表达式对象的方法,即以
RegExp.fun();
形式调用,这里包括 exec、test 这两个函数。
我们知道,正则表达式从结构上划分的话可以简单的划分为三部分:分隔符、表达式 和 标志符。
如正则表达式
/^abc$/is
中,前后两个斜杠就是分隔符,分隔符中间的内容为表达式,第二个分隔符后的is就是标志符。
本文重点讨论g标志符在js的几个正则表达式相关函数中的作用。g标志符是正则表达式标志符中点击率较高的一个标志符,其作用为让该正则表达式进行全局匹配。
什么时候该进行全局匹配,什么时候不该进行全局匹配,哪些函数支持全局匹配标志g,哪些函数又不支持?手册上没有清楚的讲述这些琐碎的知识点,那就动手写测试代码,让程序说话。
1)split:将一个字符串分割为子字符串,然后将结果作为字符串数组返回。
<script> var p = /ab/, pg = /ab/g, str = 'abcabcabc'; // split 函数 var a = str.split(p); console.log(a); // ['','c','c','c'] console.log(p.lastIndex); // 0 var ag = str.split(pg); console.log(ag); // ['','c','c','c'] console.log(pg.lastIndex); // 0 </script>
可以看到使用g标志和不使用g标志的结果一模一样,所以可以认为g标志在split函数中是无意义的。
2)search:返回与正则表达式查找内容匹配的第一个子字符串的位置。
<script> var p = /ab/, pg = /ab/g, str = 'abcabcabc'; // search 函数 a = str.search(p); console.log(a); // 0,'ab'字符串第一次出现的位置 console.log(p.lastIndex); // 0 ag = str.search(pg); console.log(ag); // 0,'ab'字符串第一次出现的位置 console.log(pg.lastIndex); // 0 </script>
可以看到使用g标志和不使用g标志的结果一模一样,所以可以认为g标志在search函数中是无意义的。
3)match:使用正则表达式模式对字符串执行查找,并将包含查找的结果作为数组返回。
<script> var p = /ab/, pg = /ab/g, str = 'abcabcabc'; // match 函数 a = str.match(p); console.log(a); // ['ab'],如果没有设置全局标志g,数组的0元素包含整个匹配,而第 1 到 n 元素包含了匹配中曾出现过的任一个子匹配。 console.log(p.lastIndex); // 0 ag = str.match(pg); console.log(ag); // ["ab", "ab", "ab"],这块手册上说的很清楚,当正则含有g标志时,全局查找,结果数组的元素0到n中包含所有匹配。 console.log(pg.lastIndex); // 0 </script>
可以看到对于match函数,使用g标志和不使用g标志差别很大。好在手册中对其说明也比较详细。
4)replace:返回根据正则表达式进行文字替换后的字符串的复制。
<script> var p = /ab/, pg = /ab/g, str = 'abcabcabc'; // replace 函数 a = str.replace(p,'#'); console.log(a); // #cabcabc console.log(p.lastIndex); // 0 ag = str.replace(pg,'#'); console.log(ag); // #c#c#c console.log(pg.lastIndex); // 0 </script>
可以看到有g标志跟没g标志的结果完全不同,没有g标志的情况下只替换第一个匹配项。
5)exec:用正则表达式模式在字符串中运行查找,并返回包含该查找结果的一个数组。
<script> var p = /ab/, pg = /ab/g, str = 'abcabcabc'; // exec 函数 a = p.exec(str); console.log(a); // ['ab'] console.log(p.lastIndex); // 0 ag = pg.exec(str); console.log(ag); // ['ab'] console.log(pg.lastIndex); // 2 </script>
exec函数手册上也说的很清楚,如果为正则表达式设置了全局标志,exec 从以 lastIndex 的值指示的位置开始查找。如果没有设置全局标志,exec 忽略 lastIndex 的值,从字符串的起始位置开始搜索。每次查找返回一个数组,数组元素除了0,1,2 ...外还包含3个属性 input、index 和 lastIndex。Input 属性包含了整个被查找的字符串。Index 属性中包含了整个被查找字符串中被匹配的子字符串的位置。LastIndex 属性中包含了匹配中最后一个字符的下一个位置。
6)test:返回一个 Boolean 值,它指出在被查找的字符串中是否存在模式。
<script> var p = /ab/, pg = /ab/g, str = 'abcabcabc'; // test 函数 a = p.test(str); console.log(a); // true console.log(p.lastIndex); // 0 ag = pg.test(str); console.log(ag); // true console.log(pg.lastIndex); // 2 </script>
test函数在有g标志时查找从正则表达式对象的lastIndex属性值(此例中该处为0)开始查找,找到一个匹配的串以后更新lastIndex属性值,如果查找完整个串都没找到匹配项,设置lastIndex属性值为0。
综上,可以看出,六个函数中只有split和search使用或者不使用g标志结果都一样。而其他四个函数都有影响,其中test函数影响最小,只是影响lastIndex属性的值,但这点正好会导致一些很难察觉的问题,比如
<script> var pg = /ab/g, str = 'abc'; a = pg.test(str); console.log(a); // true a = pg.test(str); console.log(a); // false </script>
同样的代码第一次结果为true,第二次结果为false,原因就是g标志改变了lastIndesx属性的值,而带g标志的test查找时又依靠lastIndex。
好了,就这些了,有总结的不对的地方,还请指正。