1、发现问题:

今天在读require.js源代码时,不经意读到这么一段代码:

 1 //If no name, and callback is a function, then figure out if it a
 2 //CommonJS thing with dependencies.
 3 if (!deps && isFunction(callback)) {
 4     deps = [];
 5     //Remove comments from the callback string,
 6     //look for require calls, and pull them into the dependencies,
 7     //but only if there are function args.
 8     if (callback.length) {
 9         callback
10             .toString()
11             .replace(commentRegExp, '')
12             .replace(cjsRequireRegExp, function (match, dep) {
13                 deps.push(dep);
14             });
15 
16         //May be a CommonJS thing even without require calls, but still
17         //could use exports, and module. Avoid doing exports and module
18         //work though if it just needs require.
19         //REQUIRES the function to expect the CommonJS variables in the
20         //order listed below.
21         deps = (callback.length === 1 ? ['require'] : ['require', 'exports', 'module']).concat(deps);
22     }
23 }

同样,在sea.js,也读到类似的代码段:

 1 function parseDependencies(code) {
 2   var ret = []
 3 
 4   code.replace(SLASH_RE, "")
 5       .replace(REQUIRE_RE, function(m, m1, m2) {
 6         if (m2) {
 7           ret.push(m2)
 8         }
 9       })
10 
11   return ret
12 }

或许你未曾读过这两个文件,但是这不是我提及问题的重点(如果读者对此感兴趣,可以自己到github上去找源码研究),仔细看两个代码段中,都有使用到我们今天的主角——replace

看replace传入的第一个参数,恩,是我想象的东西——一个正则表达式,但是到我读到第二个参数时,我凌乱了,尽然传入的是一个函数!确实,虽然我以前知道第二个参数可以传入函数,但是奇怪的是,它为什么没有返还值呢?

2、关于replace:

在w3cschool中有这么一段定义:

语法

stringObject.replace(regexp/substr,replacement)

参数 描述

regexp/substr

必需。规定子字符串或要替换的模式的 RegExp 对象。

请注意,如果该值是一个字符串,则将它作为要检索的直接量文本模式,而不是首先被转换为 RegExp 对象。

replacement 必需。一个字符串值。规定了替换文本或生成替换文本的函数。

 

很多和我一样的菜鸟大概会被这个描述所蒙蔽,其实当第二个参数传入函数时,我们不仅可以通过函数来动态生成并返还成要替换的文本,此刻的函数中的arguments对象会保存一些很重要的数据,举个小小的例子:

1 //定义一个检测“=数字”正则表达式和一个测试字符串
2 var reg = /\=(\d)/g,
3     testStr = 'a=1,b=2,c=3,d=3';
4 //调用testStr的replace函数
5 testStr.replace(reg, function () {
6     //打印arguments对象的详细信息
7     console.log(arguments);
8 });

在谷歌控制台下,可以看到如下的测试结果:


这个函数被执行了4次,每次执行都代表正则表达成功匹配到了字符子串,那么对应的每次执行的arguments对象里面又存的什么信息呢?

在这里,我们可以看到:

参数1——表示当前匹配到的结果;

参数2——表示匹配到的正则表达式的“组”(也就是当前正则表达式小括号里面内容——这里指“\d”);

参数3——表示匹配到的字符串的索引位置;

参数4——不用多说,就是源字符串自己。

其实,通过网上的搜索,最终可以找到replace最官方、最标准的用法,当然,通过一些资料的查询,这里传入函数的arguments对象,是一个“动态可伸缩的”的,因为我们所使用的正则表达式里面含有多个组,而这里仅仅只有一个组,所以我们“当且仅当”可以看到第二个参数。

那么,我们把正则表达式换成这样又如何呢?

1 //定义一个检测“=数字”正则表达式和一个测试字符串
2 var reg = /\=\d/g,
3     testStr = 'a=1,b=2,c=3,d=3';
4 //调用testStr的replace函数
5 testStr.replace(reg, function () {
6     //打印arguments对象的详细信息
7     console.log(arguments);
8 });

显然,如我们所愿了,我们并没有捕获到等号后面的数字:

3、运用场景:

利用正则表达式的组定义,可以方便地利用这个特性,快速地找到你想要的信息,这是解决js正则表达式不支持“零宽断言”的一个巧妙的方法,正如我给大家举的例子,我们大多时候在验证的时候,想匹配到“=”后面的数字,而不是“=”+[数字]。

回归我们文章开头的代码,了解过AMD编程的童鞋大概都知道CommonJs编程范式,require.js和sea.js在找寻一个模块的工厂函数内的依赖模块id时,将工厂函数转换成了string,并且替换掉注释之后,利用我们今天说所的这个特性,把工厂函数里面的类似require('xxx/xxx')的代码侦测出来,提取出模块id——‘xxx/xxx’,并且存到数组中,最终来形成这个模块依赖其他模块的id集合。(如果不知所云,请点击这里吧https://github.com/amdjs/amdjs-api/wiki/AMD

posted on 2013-11-04 10:35  Joo.web  阅读(248)  评论(0编辑  收藏  举报