ES6中的迭代器(Iterator)和生成器(Generator)(二)

一、内建迭代器

  迭代器是ES6的一个重要组成部分,在ES6中,已经默认为许多内建类型提供了内建迭代器,只有当这些内建迭代器无法实现目标时才需要自己创建。通常来说当定义自己的对象和类时才会遇到这种情况,否则,完全可以依靠内建的迭代器完成工作,而最常使用的可能是集合的那些迭代器

1、集合对象迭代器

  在ES6中有3种类型的集合对象:数组、Map集合与Set集合

  为了更好地访问对象中的内容,这3种对象都内建了以下三种迭代器

  (1)entries() 返回一个迭代器,其值为多个键值对

  (2)values() 返回一个迭代器,其值为集合的值

  (3)keys() 返回一个迭代器,其值为集合中的所有键名

  调用以上3个方法都可以访问集合的迭代器:

  entries()迭代器:每次调用next()方法时,entries()迭代器都会返回一个数组,数组中的两个元素分别表示集合中每个元素的键与值。如果被遍历的对象是数组,则第一个元素是数字类型的索引;如果是Set集合,则第一个元素与第二个元素都是值(Set集合中的值被同时作为键与值使用);如果是Map集合,则第一个元素为键名,第二个元素为值。

  values()迭代器:调用values()迭代器时会返回集合中所存的所有值

  keys()迭代器:keys()迭代器会返回集合中存在的每一个键。如果遍历的是数组,则会返回数字类型的键,数组本身的其他属性不会被返回;如果是Set集合,由于键与值是相同的,因此keys()和values()返回的也是相同的迭代器;如果是Map集合,则keys()迭代器会返回每个独立的键

  不同集合类型的默认迭代器:每个集合类型都有一个默认的迭代器,在for-of循环中,如果没有显式指定则使用默认的迭代器。数组和Set集合的默认迭代器是values()方法,Map集合的默认迭代器是entries()方法。有了这些默认的迭代器,可以更轻松地在for-of循环中使用集合对象

let colors = [ "red", "green", "blue" ];
let tracking = new Set([1234, 5678, 9012]);
let data = new Map();
data.set("title", "Understanding ES6");
data.set("format", "print");
// 与使用 colors.values() 相同
for (let value of colors) {
    console.log(value);
}
// 与使用 tracking.values() 相同
for (let num of tracking) {
    console.log(num);
}
// 与使用 data.entries() 相同
for (let entry of data) {
    console.log(entry);
}

  默认情况下,如果是数组和Set集合,会逐一返回集合中所有的值。如果是Map集合,则按照Map构造函数参数的格式返回相同的数组内容。

  而WeakSet集合与WeakMap集合就没有内建的迭代器,由于要管理弱引用,因而无法确切地知道集合中存在的值,也就无法迭代这些集合了

2、字符串迭代器

  自ES5发布以后,JS字符串慢慢变得更像数组了,例如,ES5正式规定可以通过方括号访问字符串中的字符(也就是说,text[0]可以获取字符串text的第一个字符,并以此类推)。由于方括号操作的是编码单元而非字符,因此无法正确访问双字节字符

var message = "A 𠮷 B" ;
for (let i=0; i < message.length; i++) {
    console.log(message[i]);
}

  在这段代码中,访问message的length属性获取索引值,并通过方括号访问来迭代并打印一个单字符字符串,但是输出的结果却与预期不符。由于双字节字符被视作两个独立的编码单元,从而最终在A与B之间打印出4个空行。

  所幸,ES6的目标是全面支持Unicode,并且我们可以通过改变字符串的默认迭代器来解决这个问题,使其操作字符而不是编码单元。现在,修改前一个示例中字符串的默认迭代器,让for-of循环输出正确的内容

var message = "A 𠮷 B" ;
for (let c of message) {
    console.log(c);
}

  这个执行结果更符合预期,通过循环语句可以直接操作字符并成功打印出Unicode字符

3、NodeList迭代器

  DOM标准中有一个NodeList类型,document对象中的所有元素都用这个类型来表示。对于编写Web浏览器环境中的JS开发者来说,需要花点儿功夫去理解NodeList对象和数组之间的差异。二者都使用length属性来表示集合中元素的数量,都可以通过方括号来访问集合中的独立元素。而在内部实现中,二者的表现非常不一致,因而会造成很多困扰

  自从ES6添加了默认迭代器后,DOM定义中的NodeList类型(定义在HTML标准而不是ES6标准中)也拥有了默认迭代器,其行为与数组的默认迭代器完全一致。所以可以将NodeList应用于for-of循环及其他支持对象默认迭代器的地方

var divs = document.getElementsByTagName("div");
for (let div of divs) {
    console.log(div.id);
}

  在这段代码中,通过调用getElementsByTagName()方法获取到document对象中所有div元素的列表,在for-of循环中遍历列表中的每一个元素并输出元素ID,实际上是按照处理数组的方式来处理NodeList的

二、高级迭代器

  迭代器的基础功能可以辅助完成很多任务,通过生成器创建迭代器的过程也很便捷,除了这些简单的集合遍历任务之外,迭代器也可以被用于完成一些复杂的任务

1、给迭代器传递参数

  迭代器既可以用迭代器的next()方法返回值,也可以在生成器内部使用yield关键字来生成值。如果给迭代器的next()方法传递参数,则这个参数的值就会替代生成器内部上条yield语句的返回值。而如果要实现更多像异步编程这样的高级功能,那么这种给迭代器传值的能力就变得至关重要

function *createIterator() {
    let first = yield 1;
    let second = yield first + 2; // 4 + 2,传参替代上一条yield语句返回值
    yield second + 3; // 5 + 3
}
let iterator = createIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next(4)); // "{ value: 6, done: false }"
console.log(iterator.next(5)); // "{ value: 8, done: false }"
console.log(iterator.next()); // "{ value: undefined, done: true }"

  第一次调用next()方法时无论传入什么参数都会被丢弃。由于传给next()方法的参数会替代上一次yield的返回值,而在第一次调用next()方法前不会执行任何yield语句,因此在第一次调用next()方法时传递参数是毫无意义的

  第二次调用next()方法传入数值4作为参数,它最后被赋值给生成器函数内部的变量first。在一个含参yield语句中,表达式右侧等价于第一次调用next()方法后的下一个返回值,表达式左侧等价于第二次调用next()方法后,在函数继续执行前得到的返回值。第二次调用next()方法传入的值为4,它会被赋值给变量first,函数则继续执行。第二条yield语句在第一次yield的结果上加了2,最终的返回值为6

  第三次调用next()方法时,传入数值5,这个值被赋值给second,最后用于第三条yield语句并最终返回数值8

2、在迭代器中抛出错误 

  除了给迭代器传递数据外,还可以给它传递错误条件。通过throw()方法,当迭代器恢复执行时可令其抛出一个错误。这种主动抛出错误的能力对于异步编程而言至关重要,也能提供模拟结束函数执行的两种方法(返回值或抛出错误),从而增强生成器内部的编程弹性。将错误对象传给throw()方法后,在迭代器继续执行时其会被抛出

function *createIterator() {
    let first = yield 1;
    let second = yield first + 2; // yield 4 + 2 ,然后抛出错误
    yield second + 3; // 永不会被执行
}
let iterator = createIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next(4)); // "{ value: 6, done: false }"
console.log(iterator.throw(new Error("Boom"))); // 从生成器中抛出了错误

  在这个示例中,前两个表达式正常求值,而调用throw()方法后,在继续执行let second求值前,错误就会被抛出并阻止了代码继续执行。这个过程与直接抛出错误很相似,二者唯一的区别是抛出的时机不同

  可以在生成器内部通过try-catch代码块来捕获这些错误

function *createIterator() {
    let first = yield 1;
    let second;
    try {
        second = yield first + 2; // yield 4 + 2 ,然后抛出错误
    } catch (ex) {
        second = 6; // 当出错时,给变量另外赋值
    }
    yield second + 3;
}
let iterator = createIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next(4)); // "{ value: 6, done: false }"
console.log(iterator.throw(new Error("Boom"))); // "{ value: 9, done: false }"
console.log(iterator.next()); // "{ value: undefined, done: true }"

  在此示例中,try-catch代码块包裹着第二条yield语句。尽管这条语句本身没有错误,但在给变量second赋值前还是会主动抛出错误,catch代码块捕获错误后将second变量赋值为6,下一条yield语句继续执行后返回9

  这里有一个有趣的现象调用throw()方法后也会像调用next()方法一样返回一个结果对象。由于在生成器内部捕获了这个错误,因而会继续执行下一条yield语句,最终返回数值9

  如此一来,next()和throw()就像是迭代器的两条指令,调用next()方法命令迭代器继续执行(可能提供一个值),调用throw()方法也会命令迭代器继续执行,但同时也抛出一个错误,在此之后的执行过程取决于生成器内部的代码

  在迭代器内部,如果使用了yield语句,则可以通过next()方法和throw()方法控制执行过程,当然,也可以使用return语句返回一些与普通函数返回语句不太一样的内容

3、生成器返回语

  由于生成器也是函数,因此可以通过return语句提前退出函数执行,对于最后一次next()方法调用,可以主动为其指定一个返回值。正如在其他函数中那样,可以通过return语句指定一个返回值。而在生成器中,return表示所有操作已经完成,属性done被设置为true;如果同时提供了相应的值,则属性value会被设置为这个值

function *createIterator() {
    yield 1;
    return;
    yield 2;
    yield 3;
}
let iterator = createIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next()); // "{ value: undefined, done: true }"

  这段代码中的生成器包含多条yield语句和一条return语句,其中return语句紧随第一条yield语句,其后的yield语句将不会被执行

  在return语句中也可以指定一个返回值,该值将被赋值给返回对象的value属性

function *createIterator() {
    yield 1;
    return 42;
}
let iterator = createIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next()); // "{ value: 42, done: true }"
console.log(iterator.next()); // "{ value: undefined, done: true }"

  在此示例中,第二次调用next()方法时返回对象的value属性值为42,done属性首次设为true;第三次调用next()方法依然返回一个对象,只是value属性的值会变为undefined。因此,通过return语句指定的返回值,只会在返回对象中出现一次,在后续调用返回的对象中,value属性会被重置为undefined

  注意:展开运算符与for-of循环语句会直接忽略通过return语句指定的任何返回值,只要done一变为true就立即停止读取其他的值。不管怎样,迭代器的返回值依然是一个非常有用的特性

4、委托生成器

  在某些情况下,我们需要将两个迭代器合二为一,这时可以创建一个生成器,再给yield语句添加一个星号,就可以将生成数据的过程委托给其他生成器。当定义这些生成器时,只需将星号放置在关键字yield和生成器的函数名之间即可

function *createNumberIterator() {
    yield 1;
    yield 2;
}
function *createColorIterator() {
    yield "red";
    yield "green";
}
function *createCombinedIterator() {
    yield *createNumberIterator();
    yield *createColorIterator();
    yield true;
}
var iterator = createCombinedIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next()); // "{ value: 2, done: false }"
console.log(iterator.next()); // "{ value: "red", done: false }"
console.log(iterator.next()); // "{ value: "green", done: false }"
console.log(iterator.next()); // "{ value: true, done: false }"
console.log(iterator.next()); // "{ value: undefined, done: true }"

  这里的生成器createCombinedIterator()先后委托了另外两个生成器createNumberlterator()和createColorlterator()。仅根据迭代器的返回值来看,它就像是一个完整的迭代器,可以生成所有的值。每一次调用next()方法就会委托相应的迭代器生成相应的值,直到最后由createNumberlterator()和cpeateColorlterator()创建的迭代器无法返回更多的值,此时执行最后一条yield语句并返回true

  有了生成器委托这个新功能,可以进一步利用生成器的返回值来处理复杂任务

function *createNumberIterator() {
    yield 1;
    yield 2;
    return 3;
}
function *createRepeatingIterator(count) {
    for (let i=0; i < count; i++) {
        yield "repeat";
    }
}
function *createCombinedIterator() {
    let result = yield *createNumberIterator();
    yield *createRepeatingIterator(result);
}
var iterator = createCombinedIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next()); // "{ value: 2, done: false }"
console.log(iterator.next()); // "{ value: "repeat", done: false }"
console.log(iterator.next()); // "{ value: "repeat", done: false }"
console.log(iterator.next()); // "{ value: "repeat", done: false }"
console.log(iterator.next()); // "{ value: undefined, done: true }"

  在生成器createCombinedlterator()中,执行过程先被委托给了生成器createNumberlterator()返回值会被赋值给变量result,执行到return 3时会返回数值3。这个值随后被传入createRepeatinglterator()作为它的参数,因而生成字符串"repeat"的yield语句会被执行三次

  无论通过何种方式调用迭代器next()方法,数值3都不会被返回,它只存在于生成器createCombinedlterator()的内部。但如果想输出这个值,则可以额外添加一条yield语句

function *createNumberIterator() {
    yield 1;
    yield 2;
    return 3;
}
function *createRepeatingIterator(count) {
    for (let i=0; i < count; i++) {
        yield "repeat";
    }
}
function *createCombinedIterator() {
    let result = yield *createNumberIterator();
    yield result;
    yield *createRepeatingIterator(result);
}
var iterator = createCombinedIterator();
console.log(iterator.next()); // "{ value: 1, done: false }"
console.log(iterator.next()); // "{ value: 2, done: false }"
console.log(iterator.next()); // "{ value: 3, done: false }"
console.log(iterator.next()); // "{ value: "repeat", done: false }"
console.log(iterator.next()); // "{ value: "repeat", done: false }"
console.log(iterator.next()); // "{ value: "repeat", done: false }"
console.log(iterator.next()); // "{ value: undefined, done: true }"

  此处新添加的yield语句显式地输出了生成器createNumberlterator()的返回值。

  注意:yield*也可直接应用于字符串,例如yield* "hello",此时将使用字符串的默认迭代器

三、异步任务执行

  生成器令人兴奋的特性多与异步编程有关,JS中的异步编程有利有弊:简单任务的异步化非常容易;而复杂任务的异步化会带来很多管理代码的挑战。由于生成器支持在函数中暂停代码执行,因而可以深入挖掘异步处理的更多用法

  执行异步操作的传统方式一般是调用一个函数并执行相应回调函数

let fs = require("fs");
fs.readFile("config.json", function(err, contents) {
    if (err) {
        throw err;
    }
    doSomethingWith(contents);
    console.log("Done");
});

  调用fs.readFile()方法时要求传入要读取的文件名和一个回调函数,操作结束后会调用该回调函数并检查是否存在错误,如果没有就可以处理返回的内容。如果要执行的任务很少,那么这样的方式可以很好地完成任务;如若需要嵌套回调或序列化一系列的异步操作,事情会变得非常复杂。此时,生成器和yield语句就派上用场了

1、简单任务执行器

  由于执行yield语句会暂停当前函数的执行过程并等待下一次调用next()方法,因此可以创建一个函数,在函数中调用生成器生成相应的迭代器,从而在不用回调函数的基础上实现异步调用next()方法

function run(taskDef) {
    // 创建迭代器,让它在别处可用
    let task = taskDef();
    // 启动任务
    let result = task.next();
    // 递归使用函数来保持对 next() 的调用
    function step() {
        // 如果还有更多要做的
        if (!result.done) {
            result = task.next();
            step();
        }
    }
    // 开始处理过程
    step();
}

  函数run()接受一个生成器函数作为参数,这个函数定义了后续要执行的任务,生成一个迭代器并将它储存在变量task中。首次调用迭代器的next()方法时,返回的结果被储存起来稍后继续使用。step()函数会检查result.done的值,如果为false则执行迭代器的next()方法,并再次执行step()操作。每次调用next()方法时,返回的最新信息总会覆写变量result。在代码的最后,初始化执行step()函数并开始整个的迭代过程,每次通过检查result.done来确定是否有更多任务需要执行

  借助这个run()函数,可以像这样执行一个包含多条yield语句的生成器

run(function*() {
    console.log(1);
    yield;
    console.log(2);
    yield;
    console.log(3);
});

  这个示例最终会向控制台输出多次调用next()方法的结果,分别为数值1、2和3。当然,简单输出迭代次数不足以展示迭代器高级功能的实用之处,下一步将在迭代器与调用者之间互相传值

2、向任务执行器传递数据

  给任务执行器传递数据的最简单办法是,将值通过迭代器的next()方法传入作为yield的生成值供下次调用。在这段代码中,只需将result.value传入next()方法即可

function run(taskDef) {
    // 创建迭代器,让它在别处可用
    let task = taskDef();
    // 启动任务
    let result = task.next();
    // 递归使用函数来保持对 next() 的调用
    function step() {
        // 如果还有更多要做的
        if (!result.done) {
            result = task.next(result.value);
            step();
        }
    }
    // 开始处理过程
    step();
}

  现在result.value作为next()方法的参数被传入,这样就可以在yield调用之间传递数据了

run(function*() {
    let value = yield 1;
    console.log(value); // 1
    value = yield value + 3;
    console.log(value); // 4
});

  此示例会向控制台输出两个数值1和4。其中,数值1取自yield 1语句中回传给变量value的值;而4取自给变量value加3后回传给value的值。现在数据已经能够在yield调用间互相传递了,只需一个小小改变便能支持异步调用

3、异步任务执行器

  之前的示例只是在多个yield调用间来回传递静态数据,而等待一个异步过程有些不同。任务执行器需要知晓回调函数是什么以及如何使用它。由于yield表达式会将值返回给任务执行器,所有的函数调用都会返回一个值,因而在某种程度上这也是一个异步操作,任务执行器会一直等待直到操作完成

  下面定义一个异步操作

function fetchData() {
    return function(callback) {
        callback(null, "Hi!");
    };
}

  本示例的原意是让任务执行器调用的所有函数都返回一个可以执行回调过程的函数,此处fetchData()函数的返回值是一个可接受回调函数作为参数的函数,当调用它时会传入一个字符串"Hi!"作为回调函数的参数并执行。参数callback需要通过任务执行器指定,以确保回调函数执行时可以与底层迭代器正确交互。尽管fetchData()是同步函数,但简单添加一个延迟方法即可将其变为异步函数

function fetchData() {
    return function(callback) {
        setTimeout(function() {
            callback(null, "Hi!");
        }, 50);
    };
}

  在这个版本的fetchData()函数中,让回调函数延迟了50ms再被调用,所以这种模式在同步和异步状态下都运行良好。只需保证每个要通过yield关键字调用的函数都按照与之相同的模式编写

  理解了函数中异步过程的运作方式,可以将任务执行器稍作修改。当result.value是一个函数时,任务执行器会先执行这个函数再将结果传入next()方法

function run(taskDef) {
    // 创建迭代器,让它在别处可用
    let task = taskDef();
    // 启动任务
    let result = task.next();
    // 递归使用函数来保持对 next() 的调用
    function step() {
        // 如果还有更多要做的
        if (!result.done) {
            if (typeof result.value === "function") {
                result.value(function(err, data) {
                    if (err) {
                        result = task.throw(err);
                        return;
                    }
                    result = task.next(data);
                    step();
                });
            } else {
                result = task.next(result.value);
                step();
            }
        }
    }
    // 开始处理过程
    step();
}

  通过===操作符检査后,如果result.value是一个函数,会传入一个回调函数作为参数调用它,回调函数遵循Node.js有关执行错误的约定:所有可能的错误放在第一个参数(err)中,结果放在第二个参数中。如果传入了err,意味着执行过程中产生了错误,这时通过task.throw()正确输出错误对象;如果没有错误产生,data被传入task.next()作为结果储存起来,并继续执行step()。如果result.value不是一个函数,则直接将其传入next()方法

  现在,这个新版的任务执行器已经可以用于所有的异步任务了。在Node.js环境中,如果要从文件中读取一些数据,需要在fs.readFile()外围创建一个包装器(wrapper),并返回一个与fetchData()类似的函数

let fs = require("fs");
    function readFile(filename) {
        return function(callback) {
            fs.readFile(filename, callback);
        };
}

  readFile()接受一个文件名作为参数,返回一个可以执行回调函数的函数。回调函数被直接传入fs.readFile()方法,读取完成后会执行它

run(function*() {
    let contents = yield readFile("config.json");
    doSomethingWith(contents);
    console.log("Done");
});

  在这段代码中没有任何回调变量,异步的readFile()操作却正常执行,除了yield关键字外,其他代码与同步代码完全一样,只不过函数执行的是异步操作。所以遵循相同的接口,可以编写一些读起来像是同步代码的异步逻辑

  当然,这些示例中使用的模式也有缺点,也就是不能百分百确认函数中返回的其他函数一定是异步的。着眼当下,最重要的是能理解任务执行过程背后的理论知识

 

posted @ 2017-12-09 22:00  古兰精  阅读(329)  评论(0编辑  收藏  举报