.10-浅析webpack源码之graceful-fs模块

  在cachedInput、output、watch三大文件系统中,output非常简单,没有必要讲,其余两个模块依赖于input模块,而input主要是引用了graceful-fs的部分API,所以这节来讲讲graceful-fs。

  上一节整理的源码如下:

var fs = require('fs')

// ...工具方法

module.exports = patch(require('./fs.js'))
if (process.env.TEST_GRACEFUL_FS_GLOBAL_PATCH) {
    module.exports = patch(fs)
}

module.exports.close = fs.close = (function(fs$close) { /*...*/ })(fs.close)

module.exports.closeSync = fs.closeSync = (function(fs$closeSync) { /*...*/ })(fs.closeSync)

function patch(fs) {
    // fs方法二次封装
    return fs
}

  内容包含:

1、工具方法

2、patch引入的fs模块并输出

3、添加close/closeSync方法

 

util.debuglog

  首先看工具方法,代码如下:

var util = require('util');// 检测此方法是否存在并返回一个debug方法
if (util.debuglog)
    debug = util.debuglog('gfs4');
// 测试进程参数NODE_DEBUG是否包含'gfs4'
else if (/\bgfs4\b/i.test(process.env.NODE_DEBUG || '')) {
    //  自定义一个debug函数
    debug = (...args) => {
        var m = util.format.apply(util, args);
        m = 'GFS4: ' + m.split(/\n/).join('\nGFS4: ');
        console.error(m);
    }
}

if (/\bgfs4\b/i.test(process.env.NODE_DEBUG || '')) {
    // 监听退出事件
    process.on('exit', function() {
        // 批量输出日志内容
        debug(queue);
        // 使用==测试参数是否相等 不等抛出error
        require('assert').equal(queue.length, 0);
    })
}

  这里会尝试调用util.debuglog来生成一个错误日志函数,每一次调用该函数会打印一条错误日志。

  在没有util.debuglog的情况下后自定义一个debug函数,测试代码如图:

const util = require('util');
debug = (...args) => {
    var m = util.format.apply(util, args);
    m = 'GFS4: ' + m.split(/\n/).join('\nGFS4: ');
    console.error(m);
}
debug(`log1
log2
log3`);

  执行后输出如图:

  这里可以顺便看一下nodejs中debuglog的源码,整理如下:

var debugs = {};
// 收集所有DEBUG的环境名
var debugEnviron;

function debuglog(set) {
    if (debugEnviron === undefined) {
        // 从NODE_DEBUG环境变量中收集所有的日志输出参数
        // 这里全部转为大写
        // 这就说明为什么debuglog传的是gfs4 输出的是GFS4
        debugEnviron = new Set(
            (process.env.NODE_DEBUG || '').split(',').map((s) => s.toUpperCase()));
    }
    set = set.toUpperCase();
    // 没有该debuglog函数就创建一个
    if (!debugs[set]) {
        // 只对指定的参数进行输出
        if (debugEnviron.has(set)) {
            var pid = process.pid;
            debugs[set] = function() {
                // 格式化参数信息
                var msg = exports.format.apply(exports, arguments);
                // 依次输出:参数名 进程号 信息
                console.error('%s %d: %s', set, pid, msg);
            };
        } else {
            debugs[set] = function() {};
        }
    }
    return debugs[set];
}

  可以看到,源码内部也是用console.error来进行错误日志输出,输出的格式比模拟方法多了一个进程号,基本上没啥区别。

  官网的实例我测不出来,先搁着,下面讲模块输出。

 

 模块输出'./fs.js'

  模块的输出有两个方式,取决的系统环境信息 TEST_GRACEFUL_FS_GLOBAL_PATCH ,这个参数可以设置,默认是undefined。

  若该值未设置,会调用本地的fs来进行patch,这个本地fs源码如下:

'use strict'

var fs = require('fs')

module.exports = clone(fs)
    // 拷贝对象
function clone(obj) {
    if (obj === null || typeof obj !== 'object')
        return obj
    if (obj instanceof Object)
        var copy = { __proto__: obj.__proto__ }
    else
        var copy = Object.create(null)
    Object.getOwnPropertyNames(obj).forEach(function(key) {
        Object.defineProperty(copy, key, Object.getOwnPropertyDescriptor(obj, key))
    })
    return copy
}

  会深拷贝基本类型,但是对于复杂类型也只是浅拷贝,测试代码如下:

const a = {
    'string': 1,
    'arr': [1],
}
const b = clone(a);
b.arr[0] = 2;
b.string = 2;
console.log(a); // {string:1,arr:[2]}
const c = a;
c.arr[0] = 3;
c.string = 3;
console.log(a); // {string:3,arr:[3]}

  总之,基本上相当于返回一个fs模块。

 

  无论如何,graceful-js都是输出patch后的fs模块,先不看同步/异步close,主要看patch方法是如何对原生API进行封装的,整理后源码如下:

function patch(fs) {
    // Everything that references the open() function needs to be in here
    // 跨平台兼容处理
    polyfills(fs)
    fs.gracefulify = patch;
    // 遗留名字
    fs.FileReadStream = ReadStream; // Legacy name.
    fs.FileWriteStream = WriteStream; // Legacy name.
    // 创建流
    fs.createReadStream = createReadStream
    fs.createWriteStream = createWriteStream

    var fs$readFile = fs.readFile;
    fs.readFile = readFile;
    // 读取文件
    function readFile(path, options, cb) { /*...*/ }

    var fs$writeFile = fs.writeFile;
    fs.writeFile = writeFile;
    // 写文件
    function writeFile(path, data, options, cb) { /*...*/ }

    var fs$appendFile = fs.appendFile;
    if (fs$appendFile)
        fs.appendFile = appendFile;
    // 文件添加内容
    function appendFile(path, data, options, cb) { /*...*/ }

    var fs$readdir = fs.readdir;
    fs.readdir = readdir;
    // 读取目录
    function readdir(path, options, cb) { /*...*/ }

    function go$readdir(args) { /*...*/ }

    if (process.version.substr(0, 4) === 'v0.8') { /*...*/ }
    // 流处理
    // 可读的流
    var fs$ReadStream = fs.ReadStream;
    ReadStream.prototype = Object.create(fs$ReadStream.prototype);
    ReadStream.prototype.open = ReadStream$open;
    // 可写的流
    var fs$WriteStream = fs.WriteStream;
    WriteStream.prototype = Object.create(fs$WriteStream.prototype);
    WriteStream.prototype.open = WriteStream$open;

    fs.ReadStream = ReadStream
    fs.WriteStream = WriteStream

    function ReadStream(path, options) { /*...*/ }

    function ReadStream$open() { /*...*/ }

    function WriteStream(path, options) { /*...*/ }

    function WriteStream$open() { /*...*/ }

    function createReadStream(path, options) { /*...*/ }

    function createWriteStream(path, options) { /*...*/ }
    var fs$open = fs.open;
    fs.open = open;
    // 以某种形式打开文件
    function open(path, flags, mode, cb) { /*...*/ }
    return fs
}

  基本上文件操作API均有涉及,兼容处理这里不讨论。

  tips:以fs$***开头的变量均为原生API,例如fs$readFile代表原生的fs.readFile

  tips:源码有些写法真的僵硬,进行了一些优化增加可读性

  功能主要分为下列几块:

1、读取文件全部内容

2、写入数据到文件

3、向文件添加数据

4、读取目录

5、打开文件

6、流相关

  依次进行讲解。

 

文件读取:readFile

  源码如下:

function readFile(path, options, cb) {
    // options参数可选
    // 若第二参数为函数 代表省略了options参数
    if (typeof options === 'function')
        cb = options, options = null;
    // 调用原生的fs.readFile
    return go$readFile(path, options, cb)

    function go$readFile(path, options, cb) {
        return fs$readFile(path, options, function(err) {
            // 如果出错记录下来
            if (err && (err.code === 'EMFILE' || err.code === 'ENFILE')) {
                // 分别为fs模块类型 参数
                enqueue([go$readFile, [path, options, cb]])
            } else {
                if (typeof cb === 'function')
                    cb.apply(this, arguments)
                retry()
            }
        })
    }
}

// 记录错误
function enqueue(elem) {
    debug('ENQUEUE', elem[0].name, elem[1])
    queue.push(elem)
}

// 重试之前产生报错的行为
function retry() {
    var elem = queue.shift()
    if (elem) {
        debug('RETRY', elem[0].name, elem[1])
        elem[0].apply(null, elem[1])
    }
}

  总结一下graceful-fs的优雅行为:

1、底层仍然调用的是nodejs原生API

2、当某个fs行为出错,该fs操作类型与参数会被记录下来

3、当某个fs行为成功执行,会尝试将最早出错的行为取出并再次执行,出错会再次被记录

  其余方法诸如writeFile、appendFile、readdir均与此类似,而流的抽象接口也并没有做什么额外操作,只是对读写操作中的open进行了上述加工,这里就不进行讲解了。

 

close/closeSync

  这两个方法用了大量注释,我还以为有啥特殊功能,代码如下:

// Always patch fs.close/closeSync, because we want to
// retry() whenever a close happens *anywhere* in the program.
// This is essential when multiple graceful-fs instances are
// in play at the same time.
module.exports.close =
    fs.close = (function(fs$close) {
        return function(fd, cb) {
            return fs$close.call(fs, fd, function(err) {
                // 关闭之前进行重试一次
                if (!err)
                    retry()

                if (typeof cb === 'function')
                    cb.apply(this, arguments)
            })
        }
    })(fs.close)

module.exports.closeSync =
    fs.closeSync = (function(fs$closeSync) {
        return function(fd) {
            // Note that graceful-fs also retries when fs.closeSync() fails.
            // Looks like a bug to me, although it's probably a harmless one.
            var rval = fs$closeSync.apply(fs, arguments)
            retry()
            return rval
        }
    })(fs.closeSync)

  其实这里的注释还是蛮有味道的,尤其是下面的closeSync,第一次见源码注释带有作者第一人称的特殊解释(me)

 

  至此,grace-ful模块解析完成,其实内容并没有多复杂。

 

posted @ 2017-12-16 00:24  书生小龙  阅读(4793)  评论(0编辑  收藏  举报