JS正则中的match与exec
主要参考W3C教程
String.match()
match() 方法将检索目标字符串,以找到一个或多个与 正则表达式regexp 匹配的文本。match()有两种情况:
1、如果 regexp 具有标志 g,则 match() 方法将执行全局检索,找到目标字符串中的所有匹配子字符串。
匹配情况 |
返回值 |
没有找到任何匹配的子串 |
null |
找到了一个或多个匹配子串 |
一个数组。数组的内容包含所有的匹配子串 |
下面是个实例:
var str ='xxtest00test11test22test'
regexp =new RegExp(/(test)(.{1})/g);
while((result = regexp.exec(str)) !=null){
document.write(result +'<br />');
document.write(regexp.lastIndex+'<br />');
}
匹配的结果如下:
返回的匹配数组:
[testaa,testbb,testcc]
并且数组不包含其他有关匹配的信息:
0:testaa
1:testbb
2:testcc
2、如果 regexp 没有标志 g,那么 match() 方法就只能目标字符串中执行一次匹配。
匹配情况 |
返回值 |
没有找到任何匹配的子串 |
null |
找到了一个或多个匹配子串 |
一个数组。数组的内容包含与它找到的匹配文本有关的信息。该数组的第 0 个元素存放的是匹配文本,而其余的元素存放的是与正则表达式的子表达式匹配的文本。除了这些常规的数组元素之外,返回的数组还含有两个对象属性。index 属性声明的是匹配文本的起始字符在目标字符串中的位置,input 属性声明的是对目标字符串的引用。 |
我们把上面例子的全局标志g拿掉,regexp = new RegExp(/(test)(.{1})/);再次得到的匹配结果如下:
返回的匹配数组:
[test0,test,0]
并且数组包含index和input信息:
0:test0
1:test
2:0
index:2
input:xxtest0test1test2test
不过有一点需要说明的是,在IE6,7,8下,返回的数组同时包含lastIndex信息,用来表示表示匹配子串的下一个位置。话说这个属性应该是在regexp上面的,所以在IE9里面去掉了。
String.exec()方法:
1、如果 regexp 不具有标志 g。
匹配情况 |
返回值 |
没有找到任何匹配的子串 |
null |
找到了一个或多个匹配子串 |
一个数组。数组的内容与调用match() 返回的数组是相同的。 |
沿用上面的例子:
result = regexp.exec(str);
返回的匹配数组:
[test0,test,0]
并且数组包含index和input信息:
0:test0
1:test
2:0
index:2
input:xxtest0test1test2test
同样,在IE6,7,8下,返回的数组同时包含lastIndex信息。
2、如果 regexp 具有标志 g。
它会在 regexp的 lastIndex 属性指定的字符处开始检索。当 exec() 找到了与表达式相匹配的文本时,在匹配后,它将把 regexp的 lastIndex 属性设置为匹配文本的最后一个字符的下一个位置。这就是说,可以通过反复调用 exec() 方法来遍历字符串中的所有匹配文本。当 exec() 再也找不到匹配的文本时,它将返回 null,并把 lastIndex 属性重置为 0。
注:无论 RegExpObject 是否是全局模式,exec() 都会把完整的细节添加到它返回的数组中。这就是 exec() 与 match() 的不同之处,后者在全局模式下返回的信息要少得多。如果要获得所有的匹配细节,就可以在全局模式下循环调用exec()方法。
类似:
var str ='xxtest00test11test22test'
regexp =new RegExp(/(test)(.{1})/g);
while((result = regexp.exec(str)) !=null){
document.write(result +'<br />');
document.write(regexp.lastIndex+'<br />');
}
对于lastIndex属性的说明:
(1) lastIndex在regexp上面,而不是返回的数组结果里面,IE6,7,8在match()方法的lastIndex实现上有bug。
(2) 如果在一个字符串中完成了一次模式匹配之后要开始检索新的字符串,就必须手动地把 lastIndex 属性重置为 0。