Linux下I/O模型

Unix下共有五种I/O模型
1. 阻塞式I/O
2. 非阻塞式I/O
3. I/O复用（select和poll）
4. 信号驱动式I/O（SIGIO）
5. 异步I/O（POSIX的aio_系列函数）

1. 阻塞式I/O(blocking I/O)：基本所有套接字都是阻塞的，下面以数据报套接字为例。

一般系统调用会从应用进程空间切换到内核空间，一段时间后再切换回来。

进程调用recvfrom，其系统调用直到数据报到达且被复制到应用进程的缓冲区中或发生错误才返回（常见的错误如系统调用被信号中断）。

进程在调用recvfrom开始到它返回的整段时间内是被阻塞的，该函数成功返回后，应用进程开始处理数据报。

阻塞调用是指调用结果返回之前，当前线程会被挂起（线程进入非可执行状态，在这个状态下，cpu不会给线程分配时间片，即线程暂停运行）。函数只有在得到结果之后才会返回。

取快递：某个时候到A楼一层（假如是内核缓冲区）取快递，但你不知道快递什么时候过来，又不能干别的事，只能死等着。但你可以睡觉（进程处于休眠状态），因为你知道快递把货送来时一定会给你打个电话（假定一定能叫醒你）。--http://blog.csdn.net/hguisu/article/details/7453390

2. 非阻塞式I/O(nonblocking I/O)：当请求的I/O操作非得把本进程投入睡眠才能完成时，拒绝睡眠并返回一个错误。

前三次调用recvfrom时没有数据返回，因此内核立即返回一个EWOULDBLOCK错误。第四次调用时已有一个数据报准备好，它被复制到应用进程缓冲区，于是recvfrom成功返回。

当一个应用进程对一个非阻塞描述符循环调用recvfrom，我们称之为轮询(polling)。应用进程持续轮询内核，以查看某个操作是否就绪。这样做会消耗大量CPU时间。

非阻塞和阻塞的概念相对应，指在不能立刻得到结果之前，该函数不会阻塞当前线程，而会立刻返回。

取快递：如果用忙轮询的方法，每隔5分钟到A楼一层(内核缓冲区）去看快递来了没有。如果没来，立即返回。而快递来了，就放在A楼一层，等你去取。

同步IO和异步IO的区别就在于：数据访问的时候进程是否阻塞！

阻塞IO和非阻塞IO的区别就在于：应用程序的调用是否立即返回！--http://blog.csdn.net/hguisu/article/details/7453390

3. I/O复用(I/O multiplexing)：主要调用select或poll，阻塞在这两个系统调用中的某一个之上，而不是阻塞在真正的I/O系统调用上。

服务器阻塞于select调用，等待数据报套接字变为可读。

当select返回套接字可读这一条件时，再调用recvfrom把所读数据报复制到应用进程缓冲区。

I/O复用使用select需要两个而不是单个系统调用，I/O复用还稍有劣势，但其优势在于可以等待多个描述符就绪。

与I/O复用密切相关的另一种I/O模型是在多线程中使用阻塞式I/O，使用多个线程可以自由地调用诸如recvfrom之类的阻塞式I/O系统调用。

4. 信号驱动式I/O(signal-driven I/O)：使用信号让内核在描述符就绪时发送SIGIO通知服务器。

我们首先开启套接字的信号驱动式I/O功能，并通过sigaction系统调用安装一个信号处理函数。该系统调用将立即返回，服务器进程继续工作（并没有阻塞）。当数据报准备好读取时，内核就为该进程产生一个SIGIO信号。随后在信号处理函数中调用recvfrom读取数据报。

5. 异步I/O(asynchronous I/O)：告知内核启动某个操作，并让内核在整个操作（包括将数据从内核复制到应用进程的缓冲区）完成后通知服务器。

异步I/O与信号驱动模型区别在于：前者由内核通知我们I/O操作何时完成；后者是由内核通知我们何时可以启动一个I/O操作。

调用aio_read函数（POSIX异步I/O函数以aio_或lio_开头），给内核传递描述符、缓冲区指针、缓冲区大小（与read相同的三个参数）和文件偏移（与lseek类似），并告诉内核当整个操作完成时如何通知我们。该系统调用立即返回，应用进程并在等待I/O完成期间不被阻塞。

各个I/O模型对比：

posted @ 2016-04-24 23:31 LarryKnight 阅读(330) 评论(0) 编辑收藏举报

LarryKnight

Linux下I/O模型

公告