探索Javascript异步编程

异步编程带来的问题在客户端Javascript中并不明显，但随着服务器端Javascript越来越广的被使用，大量的异步IO操作使得该问题变得明显。许多不同的方法都可以解决这个问题，本文讨论了一些方法，但并不深入。大家需要根据自己的情况选择一个适于自己的方法。

笔者在之前的一片博客中简单的讨论了Python和Javascript的异同，其实作为一种编程语言Javascript的异步编程是一个非常值得讨论的有趣话题。

JavaScript 异步编程简介

回调函数和异步执行

所谓的异步指的是函数的调用并不直接返回执行的结果，而往往是通过回调函数异步的执行。

我们先看看回调函数是什么：

var fn = function(callback) {
    // do something here
    ...
    callback.apply(this, para);
}；
  
var mycallback = function(parameter) {
    // do someting in customer callback
}；
  
// call the fn with callback as parameter
fn(mycallback)；

回调函数，其实就是调用用户提供的函数，该函数往往是以参数的形式提供的。回调函数并不一定是异步执行的。比如上述的例子中，回调函数是被同步执行的。大部分语言都支持回调，C++可用通过函数指针或者回调对象，Java一般也是使用回调对象。

在Javascript中有很多通过回调函数来执行的异步调用，例如setTimeout（）或者setInterval（）。

setTimeout(function(){
    console.log("this will be exectued after 1 second!");
},1000);

在以上的例子中，setTimeout直接返回，匿名函数会在1000毫秒（不一定能保证是1000毫秒）后异步触发并执行，完成打印控制台的操作。也就是说在异步操作的情境下，函数直接返回，把控制权交给回调函数，回调函数会在以后的某一个时间片被调度执行。那么为什么需要异步呢？为什么不能直接在当前函数中完成操作呢？这就需要了解Javascript的线程模型了。

Javascript线程模型和事件驱动

Javascript最初是被设计成在浏览器中辅助提供HTML的交互功能。在浏览器中都包含一个Javascript引擎，Javscript程序就运行在这个引擎之中，并且只有一个线程。单线程能都带来很多优点，程序员们可以很开心的不用去考虑诸如资源同步，死锁等多线程阻塞式编程所需要面对的恼人的问题。但是很多人会问，既然Javascript是单线程的，那它又如何能够异步的执行呢？

这就需要了解到Javascript在浏览器中的事件驱动（event driven）机制。事件驱动一般通过事件循环（event loop）和事件队列（event queue）来实现的。假定浏览器中有一个专门用于事件调度的实例（该实例可以是一个线程，我们可以称之为事件分发线程event dispatch thread），该实例的工作就是一个不结束的循环，从事件队列中取出事件，处理所有很事件关联的回调函数（event handler）。注意回调函数是在Javascript的主线程中运行的，而非事件分发线程中，以保证事件处理不会发生阻塞。

Event Loop Code:

while(true) {
 var event = eventQueue.pop();
 if(event && event.handler) {
     event.handler.execute(); // execute the callback in Javascript thread
 } else {
     sleep(); //sleep some time to release the CPU do other stuff
 }
}

通过事件驱动机制，我们可以想象Javascript的编程模型就是响应一系列的事件，执行对应的回调函数。很多UI框架都采用这样的模型（例如Java Swing）。

那为什要异步呢，同步不是很好么？

异步的主要目的是处理非阻塞，在和HTML交互的过程中，会需要一些IO操作（典型的就是Ajax请求，脚本文件加载），如果这些操作是同步的，就会阻塞其它操作，用户的体验就是页面失去了响应。

综上所述Javascript通过事件驱动机制，在单线程模型下，以异步回调函数的形式来实现非阻塞的IO操作。

Javascript异步编程带来的挑战

Javascript的单线程模型有很多好处，但同时也带来了很多挑战。

代码可读性

想象一下，如果某个操作需要经过多个非阻塞的IO操作，每一个结果都是通过回调，程序有可能会看上去像这个样子。

operation1(function(err, result) {
    operation2(function(err, result) {
        operation3(function(err, result) {
            operation4(function(err, result) {
                operation5(function(err, result) {
                    // do something useful
                })
            })
        })
    })
})

我们称之为意大利面条式（spaghetti）的代码。这样的代码很难维护。这样的情况更多的会发生在server side的情况下。

流程控制

异步带来的另一个问题是流程控制，举个例子，我要访问三个网站的内容，当三个网站的内容都得到后，合并处理，然后发给后台。代码可以这样写：

var urls = ['url1','url2','url3'];
var result = [];
  
for (var i = 0, len = urls.length(); i < len; i++ ) {
    $.ajax({
        url: urls[i],
        context: document.body,
        success: function(){
          //do something on success
          result.push("one of the request done successfully");
          if (result.length === urls.length()) {
              //do something when all the request is completed successfully
          }
        }});
}

上述代码通过检查result的长度的方式来决定是否所有的请求都处理完成，这是一个很丑陋方法，也很不可靠。

异常和错误处理

通过上一个例子，我们还可以看出，为了使程序更健壮，我们还需要加入异常处理。在异步的方式下，异常处理分布在不同的回调函数中，我们无法在调用的时候通过try…catch的方式来处理异常，所以很难做到有效，清楚。

更好的Javascript异步编程方式

“这是最好的时代，也是最糟糕的时代”

为了解决Javascript异步编程带来的问题，很多的开发者做出了不同程度的努力，提供了很多不同的解决方案。然而面对如此众多的方案应该如何选择呢？我们这就来看看都有哪些可供选择的方案吧。

Promise

Promise 对象曾经以多种形式存在于很多语言中。这个词最先由C++工程师用在Xanadu 项目中，Xanadu 项目是Web 应用项目的先驱。随后Promise 被用在E编程语言中，这又激发了Python 开发人员的灵感，将它实现成了Twisted 框架的Deferred 对象。

2007 年，Promise 赶上了JavaScript 大潮，那时Dojo 框架刚从Twisted框架汲取灵感，新增了一个叫做dojo.Deferred 的对象。也就在那个时候，相对成熟的Dojo 框架与初出茅庐的jQuery 框架激烈地争夺着人气和名望。2009 年，Kris Zyp 有感于dojo.Deferred 的影响力提出了CommonJS 之Promises/A 规范。同年，Node.js 首次亮相。

在编程的概念中，future，promise，和delay表示同一个概念。Promise翻译成中文是“承诺”，也就是说给你一个东西，我保证未来能够做到，但现在什么都没有。它用来表示异步操作返回的一个对象，该对象是用来获取未来的执行结果的一个代理，初始值不确定。许多语言都有对Promise的支持。

Promise的核心是它的then方法，我们可以使用这个方法从异步操作中得到返回值，或者是异常。then有两个可选参数（有的实现是三个），分别处理成功和失败的情景。

var promise = doSomethingAync()
promise.then(onFulfilled, onRejected)

异步调用doSomethingAync返回一个Promise对象promise，调用promise的then方法来处理成功和失败。这看上去似乎并没有很大的改进。仍然需要回调。但是和以前的区别在于，首先异步操作有了返回值，虽然该值只是一个对未来的承诺；其次通过使用then，程序员可以有效的控制流程异常处理，决定如何使用这个来自未来的值。

对于嵌套的异步操作，有了Promise的支持，可以写成这样的链式操作：

operation1().then(function (result1) {
    return operation2(result1)
}).then(function (result2) {
    return operation3(result2);
}).then(function (result3) {
    return operation4(result3);
}).then(function (result4) {
    return operation5(result4)
}).then(function (result5) {
    //And so on
});

Promise提供更便捷的流程控制，例如Promise.all()可以解决需要并发的执行若干个异步操作，等所有操作完成后进行处理。

var p1 = async1();
var p2 = async2();
var p3 = async3();
Promise.all([p1,p2,p3]).then(function(){
    // do something when all three asychronized operation finished
});

对于异常处理，

doA()
  .then(doB)
  .then(null,function(error){
      // error handling here
  })

如果doA失败，它的Promise会被拒绝，处理链上的下一个onRejected会被调用，在这个例子中就是匿名函数function（error）{}。比起原始的回调方式，不需要在每一步都对异常进行处理。这生了不少事。

以上只是对于Promise概念的简单陈述，Promise拥有许多不同规范建议（A,A+,B,KISS,C,D等），名字（Future，Promise，Defer），和开源实现。大家可以参考一下的这些链接。

如果你有选择困难综合症，面对这么多的开源库不知道如何决断，先不要急，这还只是一部分，还有一些库没有或者不完全采用Promise的概念

Non-Promise

下面列出了其它的一些开源的库，也可以帮助解决Javascript中异步编程所遇到的诸多问题，它们的解决方案各不相同，我这里就不一一介绍了。大家有兴趣可以去看看或者试用一下。

Non-3rd Party

其实，为了解决Javascript异步编程带来的问题，不一定非要使用Promise或者其它的开源库，这些库提供了很好的模式，但是你也可以通过有针对性的设计来解决。

比如，对于层层回调的模式，可以利用消息机制来改写，假定你的系统中已经实现了消息机制，你的code可以写成这样：

eventbus.on("init", function(){
    operationA(function(err,result){
        eventbus.dispatch("ACompleted");
    });
});
  
eventbus.on("ACompleted", function(){
    operationB(function(err,result){
        eventbus.dispatch("BCompleted");
    });
});
  
eventbus.on("BCompleted", function(){
    operationC(function(err,result){
        eventbus.dispatch("CCompleted");
    });
});
  
eventbus.on("CCompleted", function(){
    // do something when all operation completed
});

这样我们就把嵌套的异步调用，改写成了顺序执行的事件处理。

更多的方式，请大家参考这篇文章，它提出了解决异步的五种模式：回调、观察者模式（事件）、消息、Promise和有限状态机（FSM）。

下一代Javscript对异步编程的增强

ECMAScript6

下一代的Javascript标准Harmony，也就是ECMAScript6正在酝酿中，它提出了许多新的语言特性，比如箭头函数、类（Class）、生成器（Generator）、Promise等等。其中Generator和Promise都可以被用于对异步调用的增强。

Nodejs的开发版V0.11已经可以支持ES6的一些新的特性，使用node –harmony命令来运行对ES6的支持。

co、Thunk、Koa

koa是由Express原班人马（主要是TJ）打造，希望提供一个更精简健壮的nodejs框架。koa依赖ES6中的Generator等新特性，所以必须运行在相应的Nodejs版本上。

利用Generator、co、Thunk，可以在Koa中有效的解决Javascript异步调用的各种问题。

co是一个异步流程简化的工具，它利用Generator把一层层嵌套的调用变成同步的写法。

var co = require('co');
var fs = require('fs');
  
var stat = function(path) {
  return function(cb){
    fs.stat(path,cb);
  }
};
  
var readFile = function(filename) {
  return function(cb){
    fs.readFile(filename,cb);
  }
};
  
co(function *() {
  var stat = yield stat('./README.md');
  var content = yield readFile('./README.md');
})();

通过co可以把异步的fs.readFile当成同步一样调用，只需要把异步函数fs.readFile用闭包的方式封装。

利用Thunk可以进一步简化为如下的code, 这里Thunk的作用就是用闭包封装异步函数，返回一个生成函数的函数，供生成器来调用。

var thunkify = require('thunkify');
var co = require('co');
var fs = require('fs');
  
var stat = thunkify(fs.stat);
var readFile = thunkify(fs.readFile);
  
co(function *() {
  var stat = yield stat('./README.md');
  var content = yield readFile('./README.md');
})();

利用co可以串行或者并行的执行异步调用。

串行

co(function *() {
  var a = yield request(a);
  var b = yield request(b);
})();

并行

co(function *() {
 var res = yield [request(a), request(b)];
})();

更多详细的内容，大家可以参考这两篇文章1，2。

总结

同时，随着ES6的定义，Javascript的语法变得越来越丰富，更多的功能带来了很多便利，然而原本简洁，单一目的的Javascript变得复杂，也要承担更多的任务。Javascript何去何从，让我们拭目以待。

posted @ 2015-04-22 09:32 技术狂阅读(782) 评论(0) 编辑收藏举报

刷新页面返回顶部

技术狂