587 模块化开发 CommonJS规范:exports,module.exports,require细节,模块加载顺序,AMD和CMD规范
一. 什么是模块化开发
1.1. JavaScript设计缺陷
那么,到底什么是模块化开发呢?
- 事实上模块化开发最终的目的是将程序划分成一个个小的结构;
- 这个结构中编写属于自己的逻辑代码,有自己的作用域,不会影响到其他的结构;
- 这个结构可以将自己希望暴露的变量、函数、对象等导出给其结构使用;
- 也可以通过某种方式,导入另外结构中的变量、函数、对象等;
上面说提到的结构,就是模块;
按照这种结构划分开发程序的过程,就是模块化开发的过程;
无论你多么喜欢JavaScript,以及它现在发展的有多好,我们都需要承认在Brendan Eich用了10天写出JavaScript的时候,它都有很多的缺陷:
- 比如var定义的变量作用域问题;
- 比如JavaScript的面向对象并不能像常规面向对象语言一样使用class;
- 比如JavaScript没有模块化的问题;
Brendan Eich本人也多次承认过JavaScript设计之初的缺陷,但是随着JavaScript的发展以及标准化,存在的缺陷问题基本都得到了完善。
- JavaScript目前已经得到了快速的发展,无论是web、移动端、小程序端、服务器端、桌面应用都被广泛的使用;
在网页开发的早期,Brendan Eich开发JavaScript仅仅作为一种脚本语言,做一些简单的表单验证或动画实现等,那个时候代码还是很少的:
- 这个时候我们只需要讲JavaScript代码写到script标签中即可;
- 并没有必要放到多个文件中来编写;
<button id="btn">按钮</button>
<script>
document.getElementById("btn").onclick = function() {
console.log("按钮被点击了");
}
</script>
但是随着前端和JavaScript的快速发展,JavaScript代码变得越来越复杂了:
- ajax的出现,前后端开发分离,意味着后端返回数据后,我们需要通过JavaScript进行前端页面的渲染;
- SPA的出现,前端页面变得更加复杂:包括前端路由、状态管理等等一系列复杂的需求需要通过JavaScript来实现;
- 包括Node的实现,JavaScript编写复杂的后端程序,没有模块化是致命的硬伤;
所以,模块化已经是JavaScript一个非常迫切的需求:
- 但是JavaScript本身,直到ES6(2015)才推出了自己的模块化方案;
- 在此之前,为了让JavaScript支持模块化,涌现出了很多不同的模块化规范:AMD、CMD、CommonJS等;
在这个章节,我们将详细学习JavaScript的模块化,尤其是CommonJS和ES6的模块化。
1.2. 没有模块化的问题
我们先来简单体会一下没有模块化代码的问题。
我们知道,对于一个大型的前端项目,通常是多人开发的(即使一个人开发,也会将代码划分到多个文件夹中):
- 我们假设有两个人:小明和小丽同时在开发一个项目,并且会将自己的JavaScript代码放在一个单独的js文件中。
小明开发了aaa.js文件,代码如下(当然真实代码会复杂的多):
var flag = true;
if (flag) {
console.log("aaa的flag为true")
}
小丽开发了bbb.js文件,代码如下:
var flag = false;
if (!flag) {
console.log("bbb使用了flag为false");
}
很明显出现了一个问题:
- 大家都喜欢使用flag来存储一个boolean类型的值;
- 但是一个人赋值了true,一个人赋值了false;
- 如果之后都不再使用,那么也没有关系;
但是,小明又开发了ccc.js文件:
if (flag) { console.log("使用了aaa的flag");}
问题来了:小明发现ccc中的flag值不对
- 对于聪明的你,当然一眼就看出来,是小丽将flag赋值为了false;
- 但是如果每个文件都有上千甚至更多的代码,而且有上百个文件,你可以一眼看出来flag在哪个地方被修改了吗?
备注:引用路径如下:
<script src="./aaa.js"></script>
<script src="./bbb.js"></script>
<script src="./ccc.js"></script>
所以,没有模块化对于一个大型项目来说是灾难性的。
当然,我们有办法可以解决上面的问题:立即函数调用表达式(IIFE)
- IIFE (Immediately Invoked Function Expression)
aaa.js
const moduleA = (function () {
var flag = true;
if (flag) {
console.log("aaa的flag为true")
}
return {
flag: flag
}
})();
bbb.js
var flag = false;
if (!flag) {
console.log("bbb使用了flag为false");
}
})();
ccc.js
const moduleC = (function() {
const flag = moduleA.flag;
if (flag) {
console.log("使用了aaa的flag");
}
})();
命名冲突的问题,有没有解决呢?解决了。
但是,我们其实带来了新的问题:
- 第一,我必须记得每一个模块中返回对象的命名,才能在其他模块使用过程中正确的使用;
- 第二,代码写起来混乱不堪,每个文件中的代码都需要包裹在一个匿名函数中来编写;
- 第三,在没有合适的规范情况下,每个人、每个公司都可能会任意命名、甚至出现模块名称相同的情况;
所以,我们会发现,虽然实现了模块化,但是我们的实现过于简单,并且是没有规范的。
- 我们需要制定一定的规范来约束每个人都按照这个规范去编写模块化的代码;
- 这个规范中应该包括核心功能:模块本身可以导出暴露的属性,模块又可以导入自己需要的属性;
JavaScript社区为了解决上面的问题,涌现出一系列好用的规范,接下来我们就学习具有代表性的一些规范。
二. CommonJS规范
2.1. CommonJS和Node
我们需要知道CommonJS是一个规范,最初提出来是在浏览器意外的地方使用,并且当时被命名为ServerJS,后来为了体现它的广泛性,修改为CommonJS,平时我们也会简称为CJS。
- Node是CommonJS在服务器端一个具有代表性的实现;
- Browserify是CommonJS在浏览器中的一种实现;
- webpack打包工具具备对CommonJS的支持和转换(后面我会讲到);
所以,Node中对CommonJS进行了支持和实现,让我们在开发node的过程中可以方便的进行模块化开发:
- 在Node中每一个js文件都是一个单独的模块;
- 这个模块中包括CommonJS规范的核心变量:exports、module.exports、require;
- 我们可以使用这些变量来方便的进行模块化开发;
前面我们提到过模块化的核心是导出和导入,Node中对其进行了实现:
- exports和module.exports可以负责对模块中的内容进行导出;
- require函数可以帮助我们导入其他模块(自定义模块、系统模块、第三方库模块)中的内容;
2.2. Node模块化开发
我们来看一下两个文件:
bar.js
const name = 'hahaha';
const age = 18;
function sayHello(name) {
console.log("Hello " + name);
}
main.js
console.log(name);
console.log(age);
sayHello('kobe');
上面的代码会报错:
- 在node中每一个文件都是一个独立的模块,有自己的作用域;
- 那么,就意味着别的模块main中不能随便访问另外一个模块bar中的内容;
- bar需要导出自己想要暴露的变量、函数、对象等等;
- main从bar中导入自己想要使用的变量、函数、对象等等;
导出和导入
2.2.1. exports导出
强调:exports是一个对象,我们可以在这个对象中添加很多个属性,添加的属性会导出
bar.js中导出内容:
exports.name = name;
exports.age = age;
exports.sayHello = sayHello;
main.js中导入内容:
const bar = require('./bar');
上面这行代码意味着什么呢?
- 意味着main中的bar变量等于exports对象;
main中的bar = bar中的exports
所以,我可以编写下面的代码:
const bar = require('./bar');
const name = bar.name;
const age = bar.age;
const sayHello = bar.sayHello;
console.log(name);
console.log(age);
sayHello('kobe');
模块之间的引用关系
为了进一步论证,bar和exports是同一个对象:
- 所以,bar对象是exports对象的浅拷贝;
- 浅拷贝的本质就是一种引用赋值而已;
定时器修改对象
2.2.2. module.exports
但是Node中我们经常导出东西的时候,又是通过module.exports导出的:
- module.exports和exports有什么关系或者区别呢?
我们追根溯源,通过维基百科中对CommonJS规范的解析:
- CommonJS中是没有module.exports的概念的;
- 但是为了实现模块的导出,Node中使用的是Module的类,每一个模块都是Module的一个实例,也就是module;
- 所以在Node中真正用于导出的其实根本不是exports,而是module.exports;
- 因为module才是导出的真正实现者;
但是,为什么exports也可以导出呢?
- 这是因为module对象的exports属性是exports对象的一个引用;
- 也就是说
module.exports = exports = main中的bar
;
image-20201011163653515
注意:真正导出的模块内容的核心其实是module.exports,只是为了实现CommonJS的规范,刚好module.exports对exports对象有一个引用而已;
那么,如果我的代码这样修改了:
image-20201011164006266
你能猜到内存中会有怎么样的表现吗?
- 结论:和exports对象没有任何关系了,exports你随便玩自己的吧;
- module.exports我现在导出一个自己的对象,不带着你玩了;
- 新的对象取代了exports对象的导出,那么就意味着require导入的对象是新的对象;
image-20201011164223607
2.2.3. require细节
我们现在已经知道,require是一个函数,可以帮助我们引入一个文件(模块)中导入的对象。
那么,require的查找规则是怎么样的呢?
这里我总结比较常见的查找规则:
导入格式如下:require(X)
-
情况一:X是一个核心模块,比如path、http
-
- 直接返回核心模块,并且停止查找
-
情况二:X是以
./
或../
或/
(根目录)开头的 -
- 查找目录下面的index文件
- 1> 查找X/index.js文件
- 2> 查找X/index.json文件
- 3> 查找X/index.node文件
- 1.如果有后缀名,按照后缀名的格式查找对应的文件
- 2.如果没有后缀名,会按照如下顺序:
- 1> 直接查找文件X
- 2> 查找X.js文件
- 3> 查找X.json文件
- 4> 查找X.node文件
- 第一步:将X当做一个文件在对应的目录下查找;
- 第二步:没有找到对应的文件,将X作为一个目录
- 如果没有找到,那么报错:
not found
-
情况三:直接是一个X(没有路径),并且X不是一个核心模块
-
- 比如
/Users/hahaha/Desktop/Node/TestCode/04_learn_node/05_javascript-module/02_commonjs/main.js
中编写require('why')
- 查找顺序
- 如果上面的路径中都没有找到,那么报错:
not found
- 比如
2.2.4. 模块加载顺序
这里我们研究一下模块的加载顺序问题。
结论一:模块在被第一次引入时,模块中的js代码会被运行一次
aaa.js
const name = 'hahaha';
console.log("Hello aaa");
setTimeout(() => {
console.log("setTimeout");
}, 1000);
main.js
const aaa = require('./aaa');
aaa.js中的代码在引入时会被运行一次
结论二:模块被多次引入时,会缓存,最终只加载(运行)一次
main.js
const aaa = require('./aaa');
const bbb = require('./bbb');
aaa.js
const ccc = require("./ccc");
bbb.js
const ccc = require("./ccc");
ccc.js
console.log('ccc被加载');
ccc中的代码只会运行一次。
为什么只会加载运行一次呢?
- 这是因为每个模块对象module都有一个属性:loaded。
- 为false表示还没有加载,为true表示已经加载;
结论三:如果有循环引入,那么加载顺序是什么?
如果出现下面模块的引用关系,那么加载顺序是什么呢?
- 这个其实是一种数据结构:图结构;
- 图结构在遍历的过程中,有深度优先搜索(DFS, depth first search)和广度优先搜索(BFS, breadth first search);
- Node采用的是深度优先算法:main -> aaa -> ccc -> ddd -> eee ->bbb
多个模块的引入关系
2.3. Node的源码解析
Module类
Module类
Module.prototype.require函数
require函数
Module._load函数
_load函数的实现
三. AMD和CMD规范
3.1. CommonJS规范缺点
CommonJS加载模块是同步的:
- 同步的意味着只有等到对应的模块加载完毕,当前模块中的内容才能被运行;
- 这个在服务器不会有什么问题,因为服务器加载的js文件都是本地文件,加载速度非常快;
如果将它应用于浏览器呢?
- 浏览器加载js文件需要先从服务器将文件下载下来,之后在加载运行;
- 那么采用同步的就意味着后续的js代码都无法正常运行,即使是一些简单的DOM操作;
所以在浏览器中,我们通常不使用CommonJS规范:
- 当然在webpack中使用CommonJS是另外一回事;
- 因为它会将我们的代码转成浏览器可以直接执行的代码;
在早期为了可以在浏览器中使用模块化,通常会采用AMD或CMD:
- 但是目前一方面现代的浏览器已经支持ES Modules,另一方面借助于webpack等工具可以实现对CommonJS或者ES Module代码的转换;
- AMD和CMD已经使用非常少了,所以这里我们进行简单的演练;
3.2. AMD规范
AMD主要是应用于浏览器的一种模块化规范:
- AMD是Asynchronous Module Definition(异步模块定义)的缩写;
- 它采用的是异步加载模块;
- 事实上AMD的规范还要早于CommonJS,但是CommonJS目前依然在被使用,而AMD使用的较少了;
我们提到过,规范只是定义代码的应该如何去编写,只有有了具体的实现才能被应用:
- AMD实现的比较常用的库是require.js和curl.js;
这里我们以require.js为例讲解:
第一步:下载require.js
- 下载地址:https://github.com/requirejs/requirejs
- 找到其中的require.js文件;
第二步:定义HTML的script标签引入require.js和定义入口文件:
- data-main属性的作用是在加载完src的文件后会加载执行该文件
<script src="./lib/require.js" data-main="./index.js"></script>
第三步:编写如下目录和代码
── index.html
├── index.js
├── lib
│ └── require.js
└── modules
├── bar.js
└── foo.js
index.js
(function() {
require.config({
baseUrl: '',
paths: {
foo: './modules/foo',
bar: './modules/bar'
}
})
// 开始加载执行foo模块的代码
require(['foo'], function(foo) {
})
})();
modules/bar.js
- 如果一个模块不依赖其他,那么直接使用define(function)即可
define(function() {
const name = "hahaha";
const age = 18;
const sayHello = function(name) {
console.log("Hello " + name);
}
return {
name,
age,
sayHello
}
})
modules/foo.js
define(['bar'], function(bar) {
console.log(bar.name);
console.log(bar.age);
bar.sayHello('kobe');
})
3.3. CMD规范
CMD规范也是应用于浏览器的一种模块化规范:
- CMD 是Common Module Definition(通用模块定义)的缩写;
- 它也采用了异步加载模块,但是它将CommonJS的优点吸收了过来;
- 但是目前CMD使用也非常少了;
CMD也有自己比较优秀的实现方案:
- SeaJS
我们一起看一下SeaJS如何使用:
第一步:下载SeaJS
- 下载地址:https://github.com/seajs/seajs
- 找到dist文件夹下的sea.js
第二步:引入sea.js和使用主入口文件
seajs
是指定主入口文件的
<script src="./lib/sea.js"></script>
<script>
seajs.use('./index.js');
</script>
第三步:编写如下目录和代码
├── index.html
├── index.js
├── lib
│ └── sea.js
└── modules
├── bar.js
└── foo.js
index.js
define(function(require, exports, module) {
const foo = require('./modules/foo');
})
bar.js
define(function(require, exports, module) {
const name = 'lilei';
const age = 20;
const sayHello = function(name) {
console.log("你好 " + name);
}
module.exports = {
name,
age,
sayHello
}
})
foo.js
const bar = require('./bar');
console.log(bar.name);
console.log(bar.age);
bar.sayHello("韩梅梅");
})