21、Linux-的网络IO模型

1.IO基本概述

1.什么是IO

所谓IO，无非就是输入输出，其实大家更多关注的是磁盘IO。事实上当我们在网络中传送一些数据时，他本质上也是一种IO。

2.网络中的IO是什么样？

拿用户请求Nginx这样的web服务器获取磁盘中的文件时，系统是如何处理的？

图片来源网络

通过上面的例子，用户每一次请求都会发生一次IO操作：而每次IO，都要经由两个阶段：
第一步：将数据从磁盘中加载至内核的内存空间（缓存区），等待数据准备完成，时间较长。
第二步：将数据从内核缓冲区复制到用户空间的进程内存（缓存区），时间较短。
第三步：Nginx封装数据为响应报文发送。

2.IO网络模型

1.IO模型分为、同步、异步、阻塞、非阻塞

同步/异步（关注的是消息通知机制)
同步∶调用者发指定给被调用者，被调用者需要获取一些资源后在返回给调用者，那么此时调用者需要等待被调用者返回消息，也就意味着调用者啥也干不了。(举例:当我们将衣服扔进洗衣服，那么衣服洗完没洗完也不知道，那就需要过一段时间去看一下，对于调用者来说很繁忙。)
异步︰调用者发指定给被调用者，被调用者需要获取一些资源后在返回给调用者，此时"”被调用者"会主动将当前的运行状态通知给调用者。(举例:当我们将衣服扔进洗衣机，当洗衣机完成洗衣服之前我们可以做点别的事情，等洗完后洗衣机会通知，此时我在去晾衣服。)

阻塞/非阻塞（关注的是“调用者"在等待"被调用者"返回结果之前所处的状态)

阻塞∶指IО操作需要彻底完成后才返回到用户空间，调用结果返回之前，调用者被挂起。(举例︰将衣服仍给洗衣机，然后人一直在旁边等着，什么时候洗完什么时候执行下一步动作。)
非阻塞︰指IО操作被调用后立即返回给用户进程一个状态值，无需等待lО操作彻底完成，在最终的调用结果返回之前，调用者不会被挂起。(举例︰将衣服仍给洗衣机，然后可以去干其他的事情，等洗完后，在去处理。)

2.IO模型组合起来又有很多种情况

同步阻塞︰将衣服仍到洗衣机，然后守在洗衣机旁边，等待他什么时候洗完什么时候处理。
同步非阻塞︰将衣服仍到洗衣机，然后可以去干别的事情，那是否洗完不知道，就需要时不时看一下。异步阻塞:将衣服仍给洗衣机，还是会在旁边等着(阻塞)，洗衣机洗完了会通知。
异步非阻塞∶将衣服仍给洗衣机，可以去干其他事情，等待洗衣机洗完了会通知，然后在去取衣服。

3.五种常见的IO网络模型

3.1同步阻塞

1.当用户进程调用了recvfrom()这个系统调用，希望从磁盘获取数据
2.kernel就开始了IO的第一个阶段，准备数据，如果数据需要很长时间，那么就需要一直等待。
3.当kernel数据准备好了，会将数据从kernel中拷贝到用户进程内存，然后kernel返回数据结果，用户进程才解除阻塞状态，可以做其他事情。
总结，同步阻塞IO的特点就是在IO执行的两个阶段都被阻塞了。那么也就意味着一个进程只能响应一个用户请求，剩下请求会被挂起，会造成每次只能响应一个请求。

阻塞式IO模型

3.2同步非阻塞IO

1.当用户进程调用了recvfrom()这个系统调用，希望从磁盘获取数据。
2.那么是否完成并不知道，需要一次一次的去问。
3.当kernel 中的数据准备好了，此时用户进程再次发起系统调用，那么它马上就将数据拷贝到了用户进程内存。所以，非阻塞lO的特点是用户进程需要不断的主动询问kernel数据好了没有。好处︰用户进程可以处理其他任务，坏处︰任务完成的响应延迟增大了，因为每过一段时间才去轮询一次read操作。

非阻塞式IO

3.3IO多路复用

1.当用户进程发起调用请求，不用直接与内核交互，而是找一个应用代理进程select，当用户进程调用了select,那么整个进程会阻塞在select上(因为是由select与内核进行交互，需要等待select返回结果)。
2.kernel会“监视"select负责的数据，当任何一个进程的数据准备好了，select就会返回。
3.当select用户进程返回结果后，用户程序会再次进行系统调用，将kernel数据拷贝到用户进程。总结，select代理进程，它这一个进程可以接收多个用户进程的请求。(像办签证一样)

IO复用模型

3.4信号驱动IO

1.当用户进程调用了recvfrom)这个系统调用，希望从磁盘获取数据。
⒉磁盘文件中的数据如果还没有读取到内核时，没关系，进程还可以继续运行并不阻塞。
3.当磁盘数据复制到内核中后，会通知用户进程数据准备就绪。
4.用户进程在发指定将内核中数据复制到用户进程中，此时进程会进入阻塞状态。

信号驱动IO模型

3.5异步非阻塞IO

1.当用户进程调用了recvfrom()这个系统调用，希望从磁盘获取数据。
2.kernel收到后，会立刻返回，所以不会对用户进程产生任何阻塞。
3.kernel等待数据准备完成，并将内核数据拷贝到用户进程内存，当这一切都完成之后，kernel会给用户进程发送—个回调函数通知用户进程本次IO完成。

4.IO模型的实现

1.IO模型具体实现方式由以下几种:

Select : Linux实现对应，IO/复用模型，BSD4.2最早实现
Poll: Linux实现，对应IO复用模型，System V unix最早实现
Epoll : Linux实现，对应IO复用模型，具有信号驱动I/O模型某些特性

2.select、poll、epoll区别?

无论是select、poll、epoll都可以面对多个用户进程的请求，它相当于一个代理人，收集很多用户进程的请求，收集完成后，它帮你从磁盘上获取数据，复制到内核中，那么这个数据准备没准备好，它的实现机制是不一样的。

通知方式∶假设有一个用户数据准备好了，那么还有很多用户数据没准备好，那么如何通知呢?
select和poll是遍历扫描，效率低下。
epoll采用回调机制, epoll会主动通知，效率会更高。
lO效率:假设100个用户发请求和1000个用户发请求，在遍历的时候的性能一样吗?
select和poll用户的请求越多，所需要遍历的就越多，需要耗时就越长。
epool采用的是回调方式，无论有多少用户，它发送的时间是一样的。

那么nginx从最初设计时，就是使用的事件驱动式IO，使用边缘触发机制。同时nginx还支持异步O，用了近几年最新的服务端编程技术，来支持较好的并发

原文参考：https://www.buyao007.icu/

posted @ 2022-06-02 21:18 kirin（麒麟）阅读(179) 评论(0) 收藏举报

刷新页面返回顶部

kirin的博客

（云实例到期不续费了哈哈，以后就在博客园更新文章了）