JavaScript中奇妙的replace

1、发现问题：

今天在读require.js源代码时，不经意读到这么一段代码：

 1 //If no name, and callback is a function, then figure out if it a
 2 //CommonJS thing with dependencies.
 3 if (!deps && isFunction(callback)) {
 4     deps = [];
 5     //Remove comments from the callback string,
 6     //look for require calls, and pull them into the dependencies,
 7     //but only if there are function args.
 8     if (callback.length) {
 9         callback
10             .toString()
11             .replace(commentRegExp, '')
12             .replace(cjsRequireRegExp, function (match, dep) {
13                 deps.push(dep);
14             });
15 
16         //May be a CommonJS thing even without require calls, but still
17         //could use exports, and module. Avoid doing exports and module
18         //work though if it just needs require.
19         //REQUIRES the function to expect the CommonJS variables in the
20         //order listed below.
21         deps = (callback.length === 1 ? ['require'] : ['require', 'exports', 'module']).concat(deps);
22     }
23 }

同样，在sea.js，也读到类似的代码段：

 1 function parseDependencies(code) {
 2   var ret = []
 3 
 4   code.replace(SLASH_RE, "")
 5       .replace(REQUIRE_RE, function(m, m1, m2) {
 6         if (m2) {
 7           ret.push(m2)
 8         }
 9       })
10 
11   return ret
12 }

或许你未曾读过这两个文件，但是这不是我提及问题的重点（如果读者对此感兴趣，可以自己到github上去找源码研究），仔细看两个代码段中，都有使用到我们今天的主角——replace。

看replace传入的第一个参数，恩，是我想象的东西——一个正则表达式，但是到我读到第二个参数时，我凌乱了，尽然传入的是一个函数！确实，虽然我以前知道第二个参数可以传入函数，但是奇怪的是，它为什么没有返还值呢？

2、关于replace：

在w3cschool中有这么一段定义：

语法

stringObject.replace(regexp/substr,replacement)

参数描述

regexp/substr	必需。规定子字符串或要替换的模式的 RegExp 对象。请注意，如果该值是一个字符串，则将它作为要检索的直接量文本模式，而不是首先被转换为 RegExp 对象。
replacement	必需。一个字符串值。规定了替换文本或生成替换文本的函数。

regexp/substr

必需。规定子字符串或要替换的模式的 RegExp 对象。

请注意，如果该值是一个字符串，则将它作为要检索的直接量文本模式，而不是首先被转换为 RegExp 对象。

replacement

必需。一个字符串值。规定了替换文本或生成替换文本的函数。

很多和我一样的菜鸟大概会被这个描述所蒙蔽，其实当第二个参数传入函数时，我们不仅可以通过函数来动态生成并返还成要替换的文本，此刻的函数中的arguments对象会保存一些很重要的数据，举个小小的例子：

1 //定义一个检测“=数字”正则表达式和一个测试字符串
2 var reg = /\=(\d)/g,
3     testStr = 'a=1,b=2,c=3,d=3';
4 //调用testStr的replace函数
5 testStr.replace(reg, function () {
6     //打印arguments对象的详细信息
7     console.log(arguments);
8 });

在谷歌控制台下，可以看到如下的测试结果：

这个函数被执行了4次，每次执行都代表正则表达成功匹配到了字符子串，那么对应的每次执行的arguments对象里面又存的什么信息呢？

在这里，我们可以看到：

参数1——表示当前匹配到的结果；

参数2——表示匹配到的正则表达式的“组”（也就是当前正则表达式小括号里面内容——这里指“\d”）；

参数3——表示匹配到的字符串的索引位置；

参数4——不用多说，就是源字符串自己。

其实，通过网上的搜索，最终可以找到replace最官方、最标准的用法，当然，通过一些资料的查询，这里传入函数的arguments对象，是一个“动态可伸缩的”的，因为我们所使用的正则表达式里面含有多个组，而这里仅仅只有一个组，所以我们“当且仅当”可以看到第二个参数。

那么，我们把正则表达式换成这样又如何呢？

1 //定义一个检测“=数字”正则表达式和一个测试字符串
2 var reg = /\=\d/g,
3     testStr = 'a=1,b=2,c=3,d=3';
4 //调用testStr的replace函数
5 testStr.replace(reg, function () {
6     //打印arguments对象的详细信息
7     console.log(arguments);
8 });

显然，如我们所愿了，我们并没有捕获到等号后面的数字：

3、运用场景：

利用正则表达式的组定义，可以方便地利用这个特性，快速地找到你想要的信息，这是解决js正则表达式不支持“零宽断言”的一个巧妙的方法，正如我给大家举的例子，我们大多时候在验证的时候，想匹配到“=”后面的数字，而不是“=”+[数字]。

回归我们文章开头的代码，了解过AMD编程的童鞋大概都知道CommonJs编程范式，require.js和sea.js在找寻一个模块的工厂函数内的依赖模块id时，将工厂函数转换成了string，并且替换掉注释之后，利用我们今天说所的这个特性，把工厂函数里面的类似require('xxx/xxx')的代码侦测出来，提取出模块id——‘xxx/xxx’，并且存到数组中，最终来形成这个模块依赖其他模块的id集合。（如果不知所云，请点击这里吧https://github.com/amdjs/amdjs-api/wiki/AMD）

posted on 2013-11-04 10:35 Joo.web 阅读(248) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

1、发现问题：

2、关于replace：

语法

3、运用场景：

公告