一文弄懂 RPC 中使用哪种网络 IO 模型
常见的网络 IO 模型
网络通信是整个 RPC 调用流程的基础,那 RPC 中使用哪种网络 IO 模型呢?
常见的网络 IO 模型分为四种:同步阻塞 IO(BIO)、同步非阻塞 IO(NIO)、IO 多路复用和异步非阻塞 IO(AIO),其中最常用的就是同步阻塞 IO 和 IO 多路复用。
阻塞IO(blocking IO)
同步阻塞 IO 是最简单、最常见的 IO 模型,在 Linux 中,默认情况下所有的额socket 都是 blocking 的。
应用进程发起 IO 系统调用后,应用进程被阻塞,转到内核空间处理。内核开始等待数据,等待到数据之后,再将内核中的数据拷贝到用户内存中,整个 IO 处理完毕后返回进程,最后应用的进程解除阻塞状态,运行业务逻辑。
IO 多路复用(IO multiplexing)
多路复用 IO 是在高并发场景中使用最为广泛的一种 IO 模型,如 Java 的 NIO、Redis、Nginx 的底层实现就是此类 IO 模型的应用,Reactor 模式也是基于此类 IO 模型。
那什么是 IO 多路复用呢?多路就是指多个通道,也就是多个网络连接的 IO,而复用就是指多个通道复用在一个复用器上。
多个网络的 IO 可以注册到一个复用器上(select),当用户进程调用了 select,那么整个进程都会被阻塞。同时内核会“监视”所有 select 负责的 socket,当任何一个 socket 中的数据准备好了,select 就会返回。这个时候用户进程再调用 read 操作,将数据从内核中拷贝到用户进程。
IO 多路复用的优势在于一个线程内同时处理多个 socket 的 IO 请求,用户可以注册多个 socket,然后不断地调用 select 读取被激活的 socket ,即可达到在同时处理多个 IO 请求的目的,而在同步的阻塞模型中,有多少个 socket 就要创建多少个线程。
RPC 在网络通信上更倾向于哪种网络 IO 模型
IO 多路复用更适合于高并发的场景,可用较少的进程(线程)处理较多的 socket的 IO 请求,但使用难度比较高。而阻塞 IO 与 IO 多路复用相比,阻塞 IO 每处理一个 socket 的 IO 请求都会阻塞进程(线程),但使用难度较低。
RPC 调用在大多数的情况下,是一个高并发的调用场景,考虑到内核的支持,编程语言的支持以及 IO 模型本身的特点,在 RPC 框架的实现中,在网络通信的处理上,选择 IO 多路复用模型的方式。
巨人的肩膀:
https://time.geekbang.org/column/intro/100046201?tab=comment