IO模型
1. IO复用
进程需要这样一种功能:内核一旦发现进程指定的一个或多个IO条件(事件)就绪(输入准备好被读取或者输出准备好被输出),它通知进程,这个就叫做I/O复用。
IO复用的典型使用场景
-
客户处理多个描述符号(通常是交互式输入和网络套接字)时候,必须使用I/O复用,例如实际的网络聊天,进程既要等待用户的输入,又要处理来自网络套接字的输入,采用I/O复用可以大幅度提高并发度和节省资源;
-
TCP服务器既要处理监听套接字,又要处理已经连接的套接字,这时候需要I/O复用以提高并发性能;实际上常见的并发连接的客户数多,但是每个连接的任务轻(CPU时间短)比如多人在线聊天室;连接并发数多,但是每个连接不都是长期处于活跃状态,可能是偶尔I/O一些数据,这时候需要I/O复用,让系统别被这些Lazy的客户端拖垮;
-
如果一个服务器需要同时处理多个服务或协议,一般使用IO复用;
其实,不难看出I/O复用的目的是为了让计算机的资源得到尽可能最大化的利用,提高并行化程度达到这种目的的一种有效途径。
I/O复用在某种程度上和操作系统的中断处理机制何其的相似。
操作系统作为计算机的核心软件,管理着众多的硬件设备,具有极大的并发性能,我们可以同时听音乐,同时拷文件,同时跑程序等等;如此高的并发能力得益与中断机制给操作系统带来的异步能力,当某个硬件设备特定的事件发生时(比如磁盘就绪),就引发一个硬件中断,操作系统能捕获到这些中断,将当前运行的进程挂起,然后转而执行该中断对应的中断处理程序。
这种机制有点贪心的思想,操作系统总是尽可能的少等待,有活就干,没活就离开;这种机制中,众多硬件设备就类似与IO复用里面的众多Lazy的客户,他们需要与服务器(这里是操作系统)保持连接(做到随叫随到),但是又总是需要操作系统。中断是操作系统运行的动力源泉,这是一个典型的异步模型。I/O复用依赖于内核提供的异步能力,其抽象程度与操作系统和硬件设备的模型相似,这样能充分利用计算机的资源(软件充分利用操作系统,操作系统充分利用硬件)。
2. I/O模型
- 阻塞IO
- 非阻塞IO
- IO复用
- 信号驱动IO
- 异步IO
应用程序典型的I/O包含两个不同的阶段:
以输入为例
- IO请求就绪阶段 应用程序向内核发出请求,检查硬件设备是否准备好数据(例如等待数据从网络到达、用户键盘敲击);若硬件设备就绪,产生中断;
- IO实际读写阶段 内核捕获处理中断,然后内核空间将数据拷贝到用户的进程空间中,CPU切换到用户态;
这两个阶段的产生主要是由于计算机目前的体系结构决定的(最顶层用户程序运行在用户态,中间层内核工作在内核态,最底层是硬件);这两个阶段都有可能产生阻塞,在内核与硬件之间,应付这种阻塞采用了基于事件的中断机制以提高并发性;而在内核与用户进程之间,异步IO机制也将为用户进程并发程度提高带来曙光。
2.1 阻塞IO
最普遍的IO模型都是阻塞模型,这种模型在IO的的第一阶段(向内核发出I/O请求的系统调用)时,被阻塞直到I/O就绪,再执行实际I/O操作;
2.2 非阻塞IO
进程通知内核,进程所发起的IO请求在I/O未就绪的条件下,也不能把进程阻塞(挂起),而是返回一个错误;该模型可能需要进程不断的去轮询某个FD
是否IO
就绪,这样的轮询模型比较少见,轮询会额外的浪费大量的CPU
资源。
2.3 IO复用
该模型本质上属于非阻塞模型I/O,常见的是select
和poll
机制。对于普通的非阻塞模型,一个进程或者线程始终轮询同一个FD
,这样效率较低,特别是对于同时需要处理很多FD的程序;
而IO复用模型,可以让进程或者线程同时管理(轮询)多个FD,以select
为例,select
能够管理许多FD
上的不同事件,select
调用在所有FD
都没有IO
事件(就绪、可读、可写等)产生时会阻塞,虽然select
调用会阻塞,但是其管理轮询的FD
不是阻塞的,因此该模型依然算是非阻塞IO模型;
该模型通常和阻塞IO模型+多线程作对比,在典型的socket
服务器端,该模型和阻塞IO模型+多线程可以实现相同的功能,大多数情况下效果性能也不会差太离谱;
但是考虑在某些特定的场景下,例如客户端连接数目众多,但是每个连接今次进行IO次数比较多,IO的数据比较少(典型的就是多人在线聊天,大量的客户端同服务器保持连接,但是每一个连接“走走停停”,隔一会来几个字节的数据),在阻塞IO模型+多线程模型中,每一个连接对应于一个线程,大量的长连接会很快消耗掉计算机中(也可能是线程池)中所有线程资源,从而拒绝了额外的新的客户连接请求,但是此时计算机的CPU却是闲置的,因为很多线程其实是在阻塞状态,因此这种场景下,该模型没有很好的提高系统的并发性;
而采用I/O复用模型,用一个或多个线程去select或者poll检查多个连接上的IO事件,当IO事件(可读、可写等)发生,就利用新开线程池中的线程来处理IO,由于每一次的IO的任务很轻,并且IO数据已经来到了内核或者进程的缓冲区,这样新开的线程很快就会被线程池回收,这样当新来的客户连接请求进来,系统仍然有足够的线程资源来处理请求,极大的提高了该场景下系统的吞吐量,IO复用模型要远优于阻塞IO模型+多线程;
实际应用中,辨证的选择IO复用模型和阻塞IO模型+多线程。
2.4 信号驱动IO
进程不会阻塞在第一阶段,当IO就绪时,内核会通过信号的形式通知进程;
2.5 异步IO
进程在整个IO过程(IO请求和IO读写阶段)都不会阻塞,而是在IO完成后由内核通知进程;
2.6 同步IO与异步IO
在某些术语中,阻塞和非阻塞用于区分IO的第一个阶段,即IO的请求阶段;
同步和异步用于区分IO的第二个阶段,即IO的读写阶段;
因此,按照这个来重新分类上述五种IO模型,就可以分为
-
同步IO
- 阻塞IO (最普遍的同步阻塞BIO)
- 非阻塞IO (Java NIO, 需要轮询,不停的轮询某个FD是否就绪)
- IO复用 (Java NIO的Select机制,同时监听多个FD,虽然单个FD不阻塞,但是当所有FD都没有就绪时,select调用会阻塞;一个阻塞换来多个不阻塞)
- 信号驱动IO (同同步非阻塞IO,不用轮询,而是直接接收内核发来的IO信号)
-
异步IO (Java AIO, IO的两个阶段都不会阻塞,进程只需要发起IO请求,在IO完成两个阶段后,由内核负责通知进程,期间进程都不会挂起)
2.7 5种IO模型的Java示例
- (1)阻塞IO + 多线程
package iomodel;
import java.io.BufferedReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.io.Reader;
import java.net.ServerSocket;
import java.net.Socket;
import java.util.concurrent.Executor;
import java.util.concurrent.Executors;
public class BIODemo {
public static void main(String[] args) {
// TODO Auto-generated method stub
Executor pools = Executors.newFixedThreadPool(5);
try {
ServerSocket sS = new ServerSocket(8888);
for (;;) {
Socket s = sS.accept();//blocking
pools.execute(new BIOWorker(s));
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
class BIOWorker implements Runnable {
Socket client = null;
public BIOWorker(Socket client) {
super();
this.client = client;
}
@Override
public void run() {
// TODO Auto-generated method stub
try {
BufferedReader is = new BufferedReader(new InputStreamReader(client.getInputStream()));
String line = null;
while ((line = is.readLine()) != null)//blocking
System.out.println(line);
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
- (2)非阻塞IO模型
package iomodel;
import java.io.IOException;
import java.net.InetSocketAddress;
import java.net.ServerSocket;
import java.nio.ByteBuffer;
import java.nio.channels.ServerSocketChannel;
import java.nio.channels.SocketChannel;
import java.nio.charset.Charset;
import java.nio.charset.CharsetDecoder;
public class NBIODemo {
public static void main(String[] args) {
// TODO Auto-generated method stub
try {
Charset ascii = Charset.forName("us-ascii");
CharsetDecoder decoder = ascii.newDecoder();
ServerSocketChannel ssc = ServerSocketChannel.open();
ssc.configureBlocking(false);
ServerSocket ss = ssc.socket();
ss.bind(new InetSocketAddress("localhost", 8888));
SocketChannel sC = null;
while ((sC = ssc.accept()) == null)
System.out.println("i am pooling for new connection!");// poll until new connection was established.non-blocking
sC.configureBlocking(false);
ByteBuffer buffer = ByteBuffer.allocate(1024);
while (true) {//pool for reading
int r = sC.read(buffer);//non-blocking
System.out.println("i am pooling for new data!");
if (r > 0) {
buffer.flip();
System.err.println("recv " + r +" bytes from " + sC);
System.err.print(decoder.decode(buffer));
buffer.compact();
}
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
- (3)I/O复用
package iomodel;
import java.io.IOException;
import java.net.InetSocketAddress;
import java.net.ServerSocket;
import java.nio.ByteBuffer;
import java.nio.channels.SelectionKey;
import java.nio.channels.Selector;
import java.nio.channels.ServerSocketChannel;
import java.nio.channels.SocketChannel;
import java.nio.charset.Charset;
import java.nio.charset.CharsetDecoder;
import java.util.Iterator;
import java.util.Set;
import java.util.concurrent.Executor;
import java.util.concurrent.Executors;
public class MultiplexingIODemo {
public static void main(String[] args) {
// TODO Auto-generated method stub
Executor pool = Executors.newFixedThreadPool(5);
try {
Selector selector = Selector.open();
ServerSocketChannel ssc = ServerSocketChannel.open();
ssc.configureBlocking(false);// listening socket channel is
// non-blocking for accept()
ServerSocket ss = ssc.socket();
ss.bind(new InetSocketAddress("localhost", 8888));
ssc.register(selector, SelectionKey.OP_ACCEPT);
for (;;) {
// System.out.println("I am selecting..");
selector.select();// may block until there occurred at least one
// IO event.
Set<SelectionKey> selectKeys = selector.selectedKeys();
Iterator<SelectionKey> iterator = selectKeys.iterator();
while (iterator.hasNext()) {
SelectionKey key = iterator.next();
if ((key.readyOps() & SelectionKey.OP_ACCEPT) == SelectionKey.OP_ACCEPT) {
ServerSocketChannel ssc1 = (ServerSocketChannel) key.channel();
SocketChannel sc = ssc1.accept();
sc.configureBlocking(false);
sc.register(selector, SelectionKey.OP_READ);
iterator.remove();
System.out.println("Got connection from " + sc);
} else if ((key.readyOps() & SelectionKey.OP_READ) == SelectionKey.OP_READ) {
SocketChannel sc = (SocketChannel) key.channel();
if (key.attachment() == null) {
ByteBuffer buff = ByteBuffer.allocate(1024);
key.attach(buff);
System.out.println("first recv data from " + sc);
}
pool.execute(new IOWorker(sc, (ByteBuffer) key.attachment()));
iterator.remove();
}
}
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
class IOWorker implements Runnable {
ByteBuffer buffer = null;
SocketChannel sC = null;
Charset gb2312 = Charset.forName("gb2312");
CharsetDecoder decoder = gb2312.newDecoder();
public IOWorker(SocketChannel sC, ByteBuffer buffer) {
super();
this.sC = sC;
this.buffer = buffer;
}
@Override
public void run() {
// TODO Auto-generated method stub
int r;
try {
r = this.sC.read(buffer);
if (r > 0) {
System.err.println("recv " + r + " new bytes from " + sC);
buffer.flip();
// get first byte
// decode bytes stream
for (; buffer.hasRemaining();) {
byte fisrt = buffer.get(0);
if (Byte.toUnsignedInt(fisrt) <= 127) {// 高字节的大小判断
fisrt = buffer.get();
System.err.println("[to " + sC.socket().getPort() + " ] "+ (char) fisrt);
} else if (buffer.remaining() >= 2) {
byte[] b = new byte[2];
b[0] = buffer.get();
b[1] = buffer.get();
String s = new String(b, "gbk");
System.err.println("[to " + sC.socket().getPort() + " ] " + s);
} else
break;
}
buffer.compact();
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
- (4)异步I/O
package iomodel;
import java.io.File;
import java.io.IOException;
import java.net.InetSocketAddress;
import java.nio.ByteBuffer;
import java.nio.channels.AsynchronousFileChannel;
import java.nio.channels.AsynchronousServerSocketChannel;
import java.nio.channels.AsynchronousSocketChannel;
import java.nio.channels.CompletionHandler;
import java.nio.file.Path;
import java.nio.file.Paths;
import java.nio.file.StandardOpenOption;
import java.util.concurrent.ExecutionException;
import java.util.concurrent.Future;
public class AIODemo {
public static void main(String[] args) {
// TODO Auto-generated method stub
try {
AsynchronousFileChannel aFC = AsynchronousFileChannel.open(Paths.get("a.txt"), StandardOpenOption.READ);
System.out.println("main " + Thread.currentThread().getId());
ByteBuffer buffer = ByteBuffer.allocate((int) new File("a.txt").length());
Future<Integer> result = aFC.read(buffer, 0);
while (!result.isDone()) {
System.out.println("i am doing other useful work...");
}
buffer.flip();
System.out.println(result.get());
System.out.println("read is done");
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (InterruptedException e) {
// TODO Auto-generated catch block
e.printStackTrace();
} catch (ExecutionException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
}
}
class FileReadHandler implements CompletionHandler<Integer, AsynchronousFileChannel> {
@Override
public void completed(Integer result, AsynchronousFileChannel attachment) {
System.out.println("new connection from " + result);
}
@Override
public void failed(Throwable exc, AsynchronousFileChannel attachment) {
// TODO Auto-generated method stub
}
}
3. 总结
- 几种IO模型的优缺点,模型的阻塞、非阻塞以及同步、异步指的是什么?
- select模型与阻塞+多线程模型的区别以及使用场景;
4. References
[1] 史蒂文斯,芬纳,鲁道夫.UNIX网络编程卷一[M].北京:人民邮电出版社,2015:122-148