IO模型
IO模型介绍
同步(synchronous) IO和异步(asynchronous) IO,阻塞(blocking) IO和非阻塞(non-blocking)IO分别是什么,到底有什么区别?这个问题其实不同的人给出的答案都可能不同,比如wiki,就认为asynchronous IO和non-blocking IO是一个东西。这其实是因为不同的人的知识背景不同,并且在讨论这个问题的时候上下文(context)也不相同。所以,为了更好的回答这个问题,先限定一下本文的上下文。
本文讨论的背景是Linux环境下的network IO。本文最重要的参考文献是Richard Stevens的“UNIX® Network Programming Volume 1, Third Edition: The Sockets Networking ”,6.2节“I/O Models ”,Stevens在这节中详细说明了各种IO的特点和区别,如果英文够好的话,推荐直接阅读。Stevens的文风是有名的深入浅出,所以不用担心看不懂。本文中的流程图也是截取自参考文献。
Stevens在文章中一共比较了五种IO Model:
* blocking IO
* nonblocking IO
* IO multiplexing
* signal driven IO
* asynchronous IO
由signal driven IO(信号驱动IO)在实际中并不常用,所以主要介绍其余四种IO Model。
再说一下IO发生时涉及的对象和步骤。对于一个network IO \(这里我们以read举例\),它会涉及到两个系统对象,一个是调用这个IO的process \(or thread\),另一个就是系统内核\(kernel\)。当一个read操作发生时,该操作会经历两个阶段:
1)等待数据准备 (Waiting for the data to be ready)
2)将数据从内核拷贝到进程中(Copying the data from the kernel to the process)
记住这两点很重要,因为这些IO模型的区别就是在两个阶段上各有不同的情况。
协程是单线程下的并发,而单线程下的并发并不是对性能都有所提升,一定是监测单线程下多个任务的IO行为,遇到IO行为不要让其原地阻塞自己让它切换到另外一个任务去执行,这样就可以提高单线程的效率。
提交任务的方式;
同步:提交完任务在原地等待结果,拿到结果再运行下一行代码
异步:提交完任务后接着往下执行。通常和回调机制连在一起,异步不等结果,提交完任务,任务运行完后自动触发回调函数运行
同步不等于阻塞
阻塞:遇到IO,操作系统会把cpu夺走
套接字服务端功能,IO行为:accept(网络的输入输出),recv(),send().
accept和recv两个阶段: 1、wait data(对方把数据经过网络延迟送到自己的操作系统缓存)
2、copy data 由操作系统的缓存拷贝到应用程序的内存的阶段(这个阶段速度很快)
send(好像看不出有等的效果只有copy data)应用程序把数据拷贝到操作系统的缓存中