http://blog.csdn.net/zhangxin09/article/details/5925496
初始化nodejs的历险之旅(上)
nodejs 其源码大体上分 C/C++ 的和 JS 的,JS 文件主要集中在/lib目录里面,但别处 /src 中却有一个非常重要的 node.js(process.js) 文件,它是初始化 nodejs 的文件,在调试的时候也会经常断点在该源码上。本文基于 nodejs 0.2.0 的版本来围绕这份初始化文件谈谈对 nodejs 的认识。若不足之处,敬请提出!
nodejs的全局对象
相对于某些代码依赖于访问特定的包才能够使用的情况,nodejs 提供若干的全局对象(Global Objects)。也就是说,全局对象就可以免依赖某个包,任何时候任何地方都可以直接访问或使用那些全局对象。例如 nodejs 中一个很重要的全局对象 process,它代表在运行着的nodejs程序,并负责整个 nodejs 运行周期的调度。例如经常看到 console 也属于全局对象。可通过下面的代码让 console 配合 porcess 一起做 nodejs “空间的小型探针”。
- // 此时console也是一个全局对象(global.console = {};)
- console.log('Version: ' + process.version); // nodejs版本号
- console.log('Prefix: ' + process.installPrefix);// 安装目录
- console.log('This process is pid ' + process.pid);// 系统进程id
- console.log('This platform is ' + process.platform);// 运行平台
- console.log(sys.inspect(process.memoryUsage()));// 使用内存的情况
- // 分配nodejs内建的全局成员,/src/node.js第443行
- global.require = require;
- global.exports = self.exports;
- global.__filename = filename;
- global.__dirname = dirname;
- global.module = self;
global全局对象
因为JS里面全局对象同样也是一个特定对象,就叫作global(那是JS VM定义好的)作为关键字出现,所以最外层中一般用this访问即可(global==this)。(感谢fangzx的指正!一时疏忽混淆了Global)global 指的是最外层对象(global==this) 在初始化 nodejs 进行一开始中,反复获取和分配 global 引用(第3行开始):
- process.global.process = process;
- process.global.global = process.global;
- global.GLOBAL = global; // 所以 global 与GLOBAL是一样的,无分大小写,为啥写成那样?ry君喜欢嘛~@_@
- global.root = global;
另外,除了例子中的 console.log 外初始化过程中还提供了 consloe.info/dir/warn/trace 等的常规调试方法。
启动与退出nodejs
启动nodejs的这一环节从 process 的 API 定义的,process 此对象肩负起着许多重要的任务。我们一般从命令行输入 nodejs 的文件名执行程序,所以就要经过收集参数(读取process.argv数组)、实例化模块对象(创建Module类的实例)等等的步骤。下面 runMain 函数就是实例化模块的过程。观察源码第517行:
- // bootstrap main module.
- exports.runMain = function () {
- // Load the main module--the command line argument.
- process.mainModule = new Module(".");
- process.mainModule.loadSync(process.argv[1]);
- }
但仍未开始!真正开始的地方是第764行:
- process.loop();
实际上 loop 就是一个无限循环,无论那个 nodejs 程序有多复杂,任何一个 nodejs 程序都是从此循环处开始的。因为服务器一直在运行(守护进程的概念),所以表面上看,代码走到这里是停在这里的,恐怕不会走到最后一句 process.emit("exit");。若需要退出 nodejs 进程,则应使用 process.exit()emit(),exit() 源码如下(由此可见 exit 是事件来的):
- process.exit = function (code) {
- process.emit("exit");
- process.reallyExit(code);
- };
既然说到无限循环,那能不能挑明是哪个 loop、执行的是什么来着?我怀疑是 process._tickCallback 这个成员内部的 for loop,执行的内容保存在 nextTickQueue 队列数组中。具体的源码位置在47行起的一段。紧接着下面定义的 process.nextTick()是面向程序员的API,——文档里面也介绍过,这项清晰无误,然后这个 process._tickCallback 却是加了下划线的,难道是特殊成员??从命名上就不得不让人怀疑是让 V8 获取 loop 函数和 nextTickQueue 队列其引用而设的。也就是说 nextTickQueue 和 tickCallback 不是用于 JS 代码运行的,而是交到 V8/libev/libeio 内部去运行的。
- // nextTick()
- var nextTickQueue = [];
- process._tickCallback = function () {
- var l = nextTickQueue.length;
- if (l === 0) return;
- for (var i = 0; i < l; i++) {
- nextTickQueue[i]();
- }
- nextTickQueue.splice(0, l);
- };
- process.nextTick = function (callback) {
- nextTickQueue.push(callback);
- process._needTickCallback();
- };
坦白说,一方面况且自己是 C 鞋童……再深入也是头大,望路过诸位同好过问一下…… process.nextTick(callback) 用法就很简单,只是送入一个说明做什么的函数参数(函数类型),加入到 nextTickQueue 队列中,用法如下。据文档说并非 setTimeout(fn, 0) 一般能够达到之功效,且有效率得多。
- process.nextTick(function () {
- console.log('nextTick callback');
- });
下面则是 nextTick 的“反例”,摘自文档。
- process.on('exit', function () {
- process.nextTick(function () {
- console.log('不会运行这儿了'); // 因为已经结束循环,不会运行该函数。
- });
- console.log('About to exit.');
- });
包加载
引入自己写的包
特殊的Script对象
module机制如何工作?
计时器Timer和其他
node.js 源码有为 POSIX 而考虑的事件,例如发生信号给进程的事件,在533行起。
node.js 源码还有定义计时器的部分(第577行)。计时器不算太复杂,主要是利用事件类完成事件的触发,须要依赖抽象的事件包 var events = module.requireNative('events')。
尚有的疑问
-
最外层的匿名函数 (function (process) {……}); 最后没有用于执行的括号??到底执行了没有??
-
其他的一些涉及Linux OS 原生层面之细节
小结
国庆在家,小弟这几天都在看 nodejs 源码。所以弄出此堆字,当然还是要以源码为底本。在本文中,主要了解了一下 nodejs 关键的几个部分,包括初始化全局成员、启动 node 进程、如何进行包加载、计时器、信号事件等的问题,涉及的对象主要是 process 及其 API。其中最后,仍有一些未确定的因素、一些存疑的地方,还摸不透,希望向大家请教。幸好 ry 君写得都是平易近人的 JS,比较起天书般的 C++ 起码不用望C 兴叹、望而却步了,呵呵。当然,另一方面也反映出了 JS 作为脚本语言当是写 DSL 的用途。既然说到 JS 编码,一点印象就是,一看 nodejs 的源码没有太多的歧义等问题,真是平易近人,想必ry君自是行走于 C 与 JS 之间不但游刃,而且双管齐下,才写有如此清晰精湛的 nodejs 流,基本上阅读起来不会太吃力,好学,——也希望好用!。