Java NIO 学习笔记（七）----NIO/IO 的对比和总结

目录：
Java NIO 学习笔记（一）----概述，Channel/Buffer
Java NIO 学习笔记（二）----聚集和分散，通道到通道
 Java NIO 学习笔记（三）----Selector
Java NIO 学习笔记（四）----文件通道和网络通道
 Java NIO 学习笔记（五）----路径、文件和管道 Path/Files/Pipe
Java NIO 学习笔记（六）----异步文件通道 AsynchronousFileChannel
Java NIO 学习笔记（七）----NIO/IO 的对比和总结

学完 NIO 和 IO 后，有一个问题：什么时候应该使用 IO，什么时候应该使用 NIO ?本文将尝试阐明 NIO 和 IO 之间的差异，并提供它们的用例，以及它们对程序代码的设计影响。

NIO 和 IO 之间的主要区别

IO	NIO
以 Stream 为导向	以 Buffer 为导向
阻塞 IO	非阻塞 IO 选择器

以 Stream 为导向 vs 以 Buffer 为导向

NIO 和 IO 之间的第一个重要区别是 IO 是面向流的，其中 NIO 是面向缓冲区的。那么，这意味着什么？

面向流的 IO 意味着可以从流中一次读取一个或多个字节，可以按我们的意愿使用读取的字节。它们不会缓存在任何地方，此外，无法在流中的将数据前后移动。如果需要将读取的数据前后移动，则需要先将其缓存在缓冲区中。

NIO 的面向缓冲区的方法略有不同。将数据读入缓冲区，稍后处理该缓冲区。可以根据需要在缓冲区中前后移动。这使在处理过程中更具灵活性。但是，还需检查该缓冲区中是否包含所有需要处理的数据，并且需要确保在将更多数据读入缓冲区时，不会覆盖尚未处理的缓冲区中的数据。

阻塞 IO vs 非阻塞 IO

标准 IO 的各种流都是阻塞的。这意味着当线程调用 read() 或 write () 时，该线程将被阻塞，直到一些数据被读取或者完全写入，在此期间，线程无法执行任何其他操作。

NIO 的非阻塞模式允许线程请求从通道读取数据，并且只获取当前可用的内容，如果当前没有数据可用，就什么都不读取。线程可以继续做其他事情，而不是在数据可供读取之前保持阻塞状态。
非阻塞写入也是如此。线程可以请求将某些数据写入通道，但在完全写入之前不会一直等待它，这样，线程可以在同一时间做继续其他事情。

线程在 IO 操作中没有因为阻塞花费等待时间，通常将等待数据准备的时间用在其他通道上执行 IO 操作。也就是说，单个线程现在可以管理多个输入和输出通道。

Selector

选择器允许单个线程监视多个输入通道。可以使用选择器注册多个通道，然后使用单个线程“选择”具有可用于处理的输入的通道，或选择准备写入的通道。这种选择器机制使单个线程可以轻松管理多个通道。

NIO 和 IO 如何影响应用程序设计

无论选择 NIO 还是 IO ，可能都会影响应用程序设计的以下方面：

对 NIO 或 IO 类的API调用方式
数据的处理
用于处理数据的线程数

API 调用方式

当然，使用 NIO 时的 API 调用看起来与使用 IO 时不同。因为必须首先将数据从通道读入缓冲区，然后在缓冲区进行处理，而不是仅仅从 InputStream 读取数据字节。

数据的处理

使用纯 NIO 设计是，对比 IO 设计，数据处理也会受到影响。
在 IO 设计中，从 InputStream 或 Reader 中读取字节的数据字节。想象一下，正在处理基于行的文本数据流。例如：

Name: czwbig
Age: 21

这组文本行可以像这样处理：

InputStream input = ... ; 
BufferedReader reader = new BufferedReader(new InputStreamReader(input));

String nameLine   = reader.readLine();
String ageLine    = reader.readLine();

注意处理状态是如何根据程序执行的程度确定的。换句话说，一旦第一个 reader.readLine() 方法返回，就确定已经读取了整行文本，因为 readLine() 阻塞直到读取完整行，还知道此行包含“Name”。同样，当第二个 readLine() 调用返回时，可以知道此行包含“Age”等。

所以，只有当有新数据要读取时，程序才会进行，并且对于每个步骤，都知道该读取的数据是什么。一旦执行的线程已经读取过代码中的某个数据片段，该线程就不会再向后读取旧数据（通常不会）。下图也说明了此原则：

同上需求，NIO 实现看起来会有所不同。这里有一个简化的例子：

ByteBuffer buffer = ByteBuffer.allocate(64);

int bytesRead = inChannel.read(buffer);

注意第二行从通道读取字节到 ByteBuffer 。当该方法调用返回时，我们是不知道所需的所有数据是否都已在缓冲区内的，只知道缓冲区包含一些字节。这使得处理数据变得困难。

想象一下，在第一次读取（缓冲）调用之后，是否所有读入缓冲区的内容都是半行。例如，“Name：cz”。你能处理这些数据吗？显然不能。在处理任何数据之前，我们需要等待至少一整行数据进入缓冲区。

那么怎么知道缓冲区是否包含足够的数据来处理它？唯一方法是查看缓冲区中的数据。这样将导致：在知道所有数据是否存在之前，可能需要多次检查缓冲区中的数据（轮询）。这既低效又可能在程序设计方面变得混乱。例如：

ByteBuffer buffer = ByteBuffer.allocate(64);

int bytesRead = inChannel.read(buffer);

while(! bufferFull(bytesRead) ) {
    bytesRead = inChannel.read(buffer);
}

bufferFull() 方法必须跟踪读入缓冲区的数据量，并返回 true 或 false ，具体取决于缓冲区是否已满。换句话说，如果缓冲区已准备好进行处理，则认为它已满。

bufferFull() 方法扫描缓冲区，并且必须使缓冲区保持与调用 bufferFull() 方法之前相同的状态。如果不这样，则可能无法在正确的位置继续读入下一个数据到缓冲区中。这不是不可能的，但这是另一个需要注意的问题。

如果缓冲区已满，则可以对其进行处理。如果缓冲区还没满，有可能让程序先部分处理已到达的数据，这在的特定情况下是有意义的。但在许多情况下，不完整的数据没有处理的意义。

这个图中说明了 is-data-in-buffer-ready 循环：

总结

NIO 允许仅使用一个（或几个）线程来管理多个通道（网络连接或文件），但成本是解析数据可能比从阻塞流中读取数据时更复杂一些。

如果需要同时管理数千个打开的连接，每个只发送一些数据，例如聊天服务器，这在 NIO 中实现服务器可能是一个优势。同样，如果需要与其他计算机保持大量开放连接，例如，在 P2P 网络中，使用单个线程来管理所有出站连接可能是一个优势。下图中说明了这种一个线程，多个连接的设计：

但如果拥有较少带宽的连接，一次连接的数据量较大，那么经典的 IO 服务器实现可能更合适的。下图说明了这种典型的 IO 服务器设计：

所以，应该根据具体的情况分析，选择更适合的，而不是更新的。

posted @ 2018-12-03 09:40 czwbig 阅读(1517) 评论(0) 收藏举报

刷新页面返回顶部

czwbig

孜孜不倦，报效家国