linux: 五种IO模型(IO多路复用)
阻塞和非阻塞
侧重状态。
阻塞调用是指调用后对方一直没有给你回复,你一直等着,什么事都不能干。
非阻塞调用指在调用后一直没有给你回复,你每一段时间就问一次,你在这期间可以干别的。
同步和异步
侧重方式。
同步:甲方请求一次,乙方应答一次”这样的有序序列处理业务,只有当“一次请求一次应答”的过程结束才可以发生下一次的“一次请求一次应答”,那么就说他们采用的是同步。
异步:如果甲方只要有需要,就会发送请求,不管上次请求有没有得到乙方应答。而乙方只要甲方有请求就会接受,不是等这次请求处理完毕再接受甲方新请求。这样请求应答分开的序列,就可以认为是异步。异步情况下,请求和应答不需要一致进行,可能甲方后请求的业务,却先得到乙方的应答。同步是线性的,而异步可以认为是并发的。
每一种方式肯定对应着相应的状态。
如果请求量大, 数据量大,那么同步阻塞肯定会影响性能。
unix网络编程中将IO模型分为5类:阻塞IO,非阻塞IO,IO复用,信号驱动,异步IO。
- 阻塞IO:就是那种recv, read,一直等,等到有了数据才返回;
- 非阻塞IO:就是立即返回,设置描述符为非阻塞,但是要进程自己一直检查是否可读;
- IO复用其实也是阻塞的,不过可以用来等很多描述符,比起阻塞有了进步,可以算有点异步了,但需要阻塞着检查是否可读。对同一个描述符的IO操作也是有序的。
- 信号驱动采用信号机制等待,有了更多的进步,不用监视描述符了,而且不用阻塞着等待数据到来,被动等待信号通知,由信号处理程序处理。但对同一个描述符的IO操作还是有序的。
- 异步IO,发送IO请求后,不用等了,也不再需要发送IO请求获取结果了。等到通知后,其实是系统帮你把数据读取好了的,你等到的通知也不再是要求你去读写IO了,而是告诉你IO请求过程已经结束了。你要做的就是可以处理数据了。且同一个描述符上可能同时存在很多请求。
以上io模型的案例简单描述
- 阻塞I/O模型
老李去火车站买票,排队三天买到一张退票。
耗费:在车站一直排队,没法干别的事。 - 非阻塞I/O模型
老李去火车站买票,火车站说没有,每隔12小时去火车站问有没有退票,三天后买到一张票。
耗费:往返车站路上耗费时间,其他时间可以做别的事。 - I/O复用模型
- select/poll
老李去火车站买票,委托黄牛(内核中),然后每隔6小时电话黄牛询问,黄牛三天内买到票,然后老李去火车站交钱领票。
耗费:打电话 - epoll
老李去火车站买票,委托黄牛,黄牛买到后即通知老李去领,然后老李去火车站交钱领票。
耗费:无需打电话
-
信号驱动I/O模型
老李去火车站买票,给售票员留下电话,有票后,售票员电话通知老李,然后老李去火车站交钱领票。
耗费:无需打电话 -
异步I/O模型
老李去火车站买票,给售票员留下电话,有票后,售票员电话通知老李并快递送票上门。
耗费:无需打电话
I/O多路复用的形成原因
如果一个I/O流进来,我们就开启一个进程处理这个I/O流。那么假设现在有一百万个I/O流进来,那我们就需要开启一百万个进程一一对应处理这些I/O流(——这就是传统意义下的多进程并发处理)。思考一下,一百万个进程,你的CPU占有率会多高,这个实现方式及其的不合理。所以人们提出了I/O多路复用这个模型,一个线程,通过记录I/O流的状态来同时管理多个I/O,可以提高服务器的吞吐能力。
fd是什么
操作文件的描述符。
fd的类型为int, < 0 为非法值, >=0 为合法值。在linux中,一个进程默认可以打开的文件数为1024个,fd的范围为0~1023。
select
调用过程:
select函数的调用过程
a. 从用户空间将fd_set拷贝到内核空间
b. 注册回调函数
c. 调用其对应的poll方法
d. poll方法会返回一个描述读写是否就绪的mask掩码,根据这个mask掩码给fd_set赋值。
e. 如果遍历完所有的fd都没有返回一个可读写的mask掩码,就会让select的进程进入休眠模式,直到发现可读写的资源后,重新唤醒等待队列上休眠的进程。如果在规定时间内都没有唤醒休眠进程,那么进程会被唤醒重新获得CPU,再去遍历一次fd。
f. 将fd_set从内核空间拷贝到用户空间
缺点:
两次拷贝耗时(从用户空间将fd_set拷贝到内核空间, 将fd_set从内核空间拷贝到用户空间)
轮询所有fd耗时(遍历完所有的fd查看是否返回一个可读写的mask掩码)
支持的文件描述符太小(1024)
优点:
跨平台支持
poll
优点:
连接数(也就是文件描述符)没有限制(链表存储)
poll函数的调用过程与select完全一致
缺点:
大量拷贝,水平触发(当报告了fd没有被处理,会重复报告,很耗性能)
epoll
epoll的ET与LT模式
LT:延迟处理,当检测到描述符事件通知应用程序,应用程序不立即处理该事件。那么下次会再次通知应用程序此事件。
ET:立即处理,当检测到描述符事件通知应用程序,应用程序会立即处理。
ET模式减少了epoll被重复触发的次数,效率比LT高。我们在使用ET的时候,必须采用非阻塞套接口,避免某文件句柄在阻塞读或阻塞写的时候将其他文件描述符的任务饿死。
epoll的函数调用流程
a. 当调用epoll_wait函数的时候,系统会创建一个epoll对象,每个对象有一个evenpoll类型的结构体与之对应,结构体成员结构如下。
rbn,代表将要通过epoll_ctl向epll对象中添加的事件。这些事情都是挂载在红黑树中。
rdlist,里面存放的是将要发生的事件。
b. 文件的fd状态发生改变,就会触发fd上的回调函数
c. 回调函数将相应的fd加入到rdlist,导致rdlist不空,进程被唤醒,epoll_wait继续执行。
d. 有一个事件转移函数——ep_events_transfer,它会将rdlist的数据拷贝到txlist上,并将rdlist的数据清空。
e. ep_send_events函数,它扫描txlist的每个数据,调用关联fd对应的poll方法去取fd中较新的事件,将取得的事件和对应的fd发送到用户空间。如果fd是LT模式的话,会被txlist的该数据重新放回rdlist,等待下一次继续触发调用。
epoll的优点
没有最大并发连接的限制
只有活跃可用的fd才会调用callback函数
内存拷贝是利用mmap()文件映射内存的方式加速与内核空间的消息传递,减少复制开销。(内核与用户空间共享一块内存)
只有存在大量的空闲连接和不活跃的连接的时候,使用epoll的效率才会比select/poll高。
所以epoll相比select和poll,相当的利用最大连接数并节省内存