nodejs学习笔记之包、模块实现

简单了解了node的安装和一些基本的常识之后，今天学习了node中很重要的包和模块的一些知识点。

首先学习一下包的规范，它由包结构和包描述两部分组成。包结构用于组织包的各种文件，包描述用于描述包的信息，供外部读取分析。

完全符合CommonJS规范的包目录包含一下结构：

    package.json: 包的描述文件
    bin: 用于存放可执行的二进制文件的目录 
    lib: 用于存放javascript的目录 
    doc: 用于存放文档的目录 
    test: 用于存放单元测试用例的代码
    node_modules: 第三方模块
    README.md: 关于描述

下面以知名框架express项目的package.json文件，讲解一下个参数的含义：

{
  "name": "express", //包名由小写字母和数字组成，包含._-，但不允许空格，包名须是唯一的
  "description": "Sinatra inspired web development framework", //包介绍
  "version": "4.4.4", //版本号，用于版本控制，一般是major.minor.revision格式
  "author": { //包作者
    "name": "TJ Holowaychuk",
    "email": "tj@vision-media.ca"
  },
  "contributors": [ //贡献者列表，每个维护者由name、email和web组成
    {
      "name": "Aaron Heckmann",
      "email": "aaron.heckmann+github@gmail.com"
    },
    {
      "name": "Ciaran Jessup",
      "email": "ciaranj@gmail.com"
    },
    {
      "name": "Douglas Christopher Wilson",
      "email": "doug@somethingdoug.com"
    },
    {
      "name": "Guillermo Rauch",
      "email": "rauchg@gmail.com"
    },
    {
      "name": "Jonathan Ong",
      "email": "me@jongleberry.com"
    },
    {
      "name": "Roman Shtylman"
    }
  ],
  "keywords": [ //关键词数组，有利于用户快速查找到
    "express",
    "framework",
    "sinatra",
    "web",
    "rest",
    "restful",
    "router",
    "app",
    "api"
  ],
  "repository": { //托管源代码的位置
    "type": "git",
    "url": "git://github.com/visionmedia/express"
  },
  "license": "MIT", //许可证列表
  "dependencies": { //当前包所依赖的包列表
    "accepts": "~1.0.5",
    "buffer-crc32": "0.2.3",
    "debug": "1.0.2",
    "escape-html": "1.0.1",
    "methods": "1.0.1",
    "parseurl": "1.0.1",
    "proxy-addr": "1.0.1",
    "range-parser": "1.0.0",
    "send": "0.4.3",
    "serve-static": "1.2.3",
    "type-is": "1.2.1",
    "vary": "0.1.0",
    "cookie": "0.1.2",
    "fresh": "0.2.2",
    "cookie-signature": "1.0.3",
    "merge-descriptors": "0.0.2",
    "utils-merge": "1.0.0",
    "qs": "0.6.6",
    "path-to-regexp": "0.1.2"
  },
  "devDependencies": { //一些模块只有在开发的时候需要依赖，用于提示后续开发者
    "after": "0.8.1",
    "istanbul": "0.2.10",
    "mocha": "~1.20.1",
    "should": "~4.0.4",
    "supertest": "~0.13.0",
    "connect-redis": "~2.0.0",
    "ejs": "~1.0.0",
    "jade": "~1.3.1",
    "marked": "0.3.2",
    "multiparty": "~3.2.4",
    "hjs": "~0.0.6",
    "body-parser": "~1.4.3",
    "cookie-parser": "~1.3.1",
    "express-session": "~1.5.0",
    "method-override": "2.0.2",
    "morgan": "1.1.1",
    "vhost": "2.0.0"
  },
  "engines": { //支持的javascript引擎列表
    "node": ">= 0.10.0"
  },
  "scripts": { //脚本说明对象
    "prepublish": "npm prune",
    "test": "mocha --require test/support/env --reporter dot --check-leaks test/ test/acceptance/",
    "test-cov": "istanbul cover node_modules/mocha/bin/_mocha -- --require test/support/env --reporter dot --check-leaks test/ test/acceptance/",
    "test-travis": "istanbul cover node_modules/mocha/bin/_mocha --report lcovonly -- --require test/support/env --reporter spec --check-leaks test/ test/acceptance/"
  },
  "bugs": { //反馈bug的地址
    "url": "https://github.com/visionmedia/express/issues"
  },
  "homepage": "https://github.com/visionmedia/express" //主页地址
}

其次学习一下模块的实现，尽管规范中exports、require、module听起来很简单，我们还是需要了解一下这个过程中究竟经历了什么。

node中引入模块需要经历三个步骤：路径分析、文件定位、编译执行。

我们知道在node中模块主要分为两大部分：核心模块由node本身提供，文件模块由用户编写。它们的执行速度明显核心模块优于文件模块，因为核心模块在node编译的过程中，编译进了二进制执行文件，省略掉了文件定位和编译执行，并且在路径分析中优先判断。文件模块需要完整的路径分析、文件定位和编译执行。需要注意的是node中也有缓存机制，相同的模块在第二次加载的时候，优先从缓存加载，并且核心模块的缓存检查优于文件模块。

第一个步骤：路径分析

require接收一个表示符作为参数，标识符在node中分为以下几类：

核心模块：如http、fs
.或..开始的相对路径文件模块
以/开始的绝对路径文件模块
分路径形式的文件模块

前三类都很明确根据路径查找，不需要做过多的讲解。文件模块的路径生成规则是：首先查找当前目录下的node_modules目录；其次查找父目录下的node_modules目录；再次查找父目录的父目录下的node_modules；最后不断向上递归查找，直到根目录的node_modules目录。总而言之一句话：一直向上找，直到找到根目录，如果找不到会进入文件文件定位阶段。

第二个步骤：文件定位

我们知道在我们写require的时可以不叫扩展名，这个时候就需要一个规则，来判断到底使用的是什么后缀的文件，这里就会用到文件定位。首先会补全扩展名查找，补全的顺序是：.js、.node、.json。如果补全之后还没有找到的话，会把这个表示符作为一个目录查找，找到这个目录后会，查找当前目录下是否有package.json，提取main的属性值进行定位，如果没有main的话，会查找index，然后一次查找index.js、index.json、index.node，如果还是找不到的话，就会抛出查找失败的异常。

第三个步骤：编译执行

编译和执行是引入模块的最后一个阶段。定位到文件后，会新建一个模块对象，然后根据路径载入并编译。对于不同的扩展名，载入方式也不同。

.js文件，通过fs模块同步读取文件后编译执行
.node文件，这是C/C++编写的扩展文件，通过dlopen()方法加载最后编译生成文件文件
.json文件，通过fs模块同步读取文件后，用JSON.parse()解析返回结果
其他文件，它们都被当作.js文件载入

以上是学习过程中整理的笔记，方便以后学习。

参考文献：

深入浅出nodejs -- 朴灵

posted @ 2014-06-22 23:19 黑MAO 阅读(1590) 评论(0) 收藏举报

刷新页面返回顶部