nodejs stream基础知识

分类

nodejs 的 stream 有四种:

  • Readable:可读流
  • Writable: 可写流
  • Duplex:双工流
  • Transform:转换流

Readable

// _read方法是从底层系统读取具体数据的逻辑,即生产数据的逻辑。
// 在_read方法中,通过调用push(data)将数据放入可读流中供下游消耗。
// 在_read方法中,可以同步调用push(data),也可以异步调用。
// 当全部数据都生产出来后,必须调用push(null)来结束可读流。
// 流一旦结束,便不能再调用push(data)添加数据。
// 创建一个可以读的流,通过这个流对象监听数据
const stream = require('stream');
const Readable = stream.Readable;

class MyFileReader extends Readable {
  constructor(options) {
    super(options);
  }

  attachDataSource(dataSource) {
    this.dataSource = dataSource;
  }

  // 实现 _read 方法
  _read() {
    // 通过 DataSource 传入数据
    // 当 DataSource get 方法返回 null 会触发 Readable 的 end 事件,表示会结束
    this.push(this.dataSource.get());
  }
}

class DataSource {
  constructor(size = 10) {
    this.size = size;
    this.data = [];

    this.fill();
  }

  // 生产数据
  fill() {
    for (let index = 0; index < this.size; index++) {
      this.data.push(index.toString());
    }
  }

  // 获取数据
  get() {
    if (this.data.length === 0) {
      return null;
    }

    return this.data.pop();
  }
}

const dataSource = new DataSource();
const myFileReader = new MyFileReader();

myFileReader.attachDataSource(dataSource);
myFileReader.on('data', (data) => console.log('data: ' + data));
myFileReader.on('end', () => console.log('end'));

在 _read 方法里,可以调用 push 方法往缓冲池里放入数据,这里写的this.push(this.dataSource.get())方法是一个同步方法,获取完数据后立马再次执行 _read 方法获取下一条数据,如果你在_read 方法里写一个异步push 的数据

 setTimeout(() => {
   this.push(this.dataSource.get());
 });

那么本次 _read 方法执行后,没有数据则不会执行下一次 _read 方法,直到 state 发生了变化,具体的细节可以参看:https://blog.csdn.net/shasharoman/article/details/80251512 这篇文章

Writable

// 上游通过调用writable.write(data)将数据写入可写流中。write()方法会调用_write()将data写入底层。
// 在_write中,当数据成功写入底层后,必须调用next(err)告诉流开始处理下一个数据。
// next的调用既可以是同步的,也可以是异步的。
// 上游必须调用writable.end(data)来结束可写流,data是可选的。此后,不能再调用write新增数据。
// 在end方法调用后,当所有底层的写操作均完成时,会触发finish事件。

const Writable = require('stream').Writable

class ToWritable extends Writable{
  constructor(){
    super();
  }

  _write(data, enc, next) {
    // 将流中的数据写入底层
    process.stdout.write(data.toString().toUpperCase());
    // 写入完成时,调用`next()`方法通知流传入下一个数据
    process.nextTick(next);
  }
}

const writable = new ToWritable();

writable.on('finish', () => process.stdout.write('DONE'));

// 将一个数据写入流中
writable.write(`a\n`);
writable.write(`b\n`);
writable.write(`c\n`);

// 再无数据写入流时,需要调用`end`方法
writable.end();

Duplex

// 代码中实现了_read方法,所以可以监听data事件来消耗Duplex产生的数据。
// 同时,又实现了_write方法,可作为下游去消耗数据。

const Duplex = require('stream').Duplex

class ToDuplexable extends Duplex{
  constructor(){
    super();
    this.limit = 0;
  }

  _write(buf, enc, next) {
    this.limit ++ ;
    next();
  }

  _read() {
    if(this.limit--){
      this.push('data');
    }
    // this.push(this.index++)
  }
}

const toDuplexable = new ToDuplexable();

toDuplexable.on('data', data => process.stdout.write(data));
toDuplexable.on('end', () => process.stdout.write('DONE'));

toDuplexable.write('');

setTimeout(() => {
  toDuplexable.write('');
  toDuplexable.end();
}, 1000);

Transform

// Duplex 可读流中的数据(0, 1)与可写流中的数据('a', 'b')是隔离开的,但在Transform中可写端写入的数据经变换后会自动添加到可读端
//Tranform继承自Duplex,并已经实现了_read和_write方法,同时要求用户实现一个_transform方法。

const Transform = require('stream').Transform

class MyTransform extends Transform{
  constructor() {
    super()
  }

  _transform(buf, enc, next){
    let res = buf.toString('utf8');

    // 调用push方法将变换后的数据添加到可读端
    this.push(`${res}_transform\n`);
    // 调用next方法准备处理下一个
    next();
  }
}

var myTransform = new MyTransform();

myTransform.on('data', data => process.stdout.write(data));

myTransform.write('abc');
myTransform.write('def');
myTransform.end();

参考:

posted @ 2017-07-26 15:39  buzzjan  阅读(573)  评论(0编辑  收藏  举报