Java 中的 I/O
I/O 指的是 input 和 output ,也就是输入和输出,我们说的是 Java 中的 I/O,那我们就在站在虚拟机的角度去看看有哪些输入和输出。输入又可以称为数据源端,能想到的会有,文件,网络,控制台手动输入。而输出又可以称为数据接收端,能想到依旧还是那几个,输出到文件,网络,控制台。
那好,目前只是理清楚了数据从哪里来到哪里去,然而,我们的数据交互肯定不是这么的简单,我们还需要考虑数据传输的多种方式,我是以字符传输还是字节传输,或是二进制传输,要不要缓冲存取,等等问题。这样一来,想要表示出数据的传输可想而知肯定会需要很多对象。
为了解决上述存在的多种多样的数据端和数据交互方式,Java 设计者们以避免设计过多的类为初衷(其实类并不少...)设计了 I/O 体系。
先来放整体图,这个图简易却不简单,今天我也只是说其中的一小部分东西,好多的实现类都没有拿出来单独说。
首先来看看 File 类,File 类以抽象的方式代表文件名和目录路径名。该类主要用于文件和目录的创建、文件的查找和文件的删除等。看清楚了,File 类虽然名字看起来像是指文件,实际上并非如此,它既能代表一个特定文件的名称,又能代表一个目录下一组文件的名称。
我们来看个例子感受一下 File 类的使用。
public static void main(String args[]) { String dirname = "."; File f1 = new File(dirname); //当前项目工作目录 if (f1.isDirectory()) { System.out.println("Directory of " + dirname); String s[] = f1.list(); for (int i = 0; i < s.length; i++) { File f = new File(dirname + "/" + s[i]); if (f.isDirectory()) { System.out.println(s[i] + " is a directory"); } else { System.out.println(s[i] + " is a file"); } } } else { System.out.println(dirname + " is not a directory"); } }
那我想要向文件中读取或是写入内容怎么办呢 ?那就需要借助输入输出流来完成了。
首先说一下流的概念,流代表任何有能力产出数据的数据源对象或者是有能力接收数据的接收端对象。划重点,流代表的是对象。这个对象有发送或接收数据的能力。所以说流的本质也就是将数据源(数据源端,数据接受端)和数据的传输方式(字符,字节,二进制等)抽象成类的结果。作用就是为了传输数据。
在 I/O 体系中,因为需要的流有太多,Java 设计者又避免设计过多的类,所以最终采用装饰者模式来对整个流结构进行设计,按功能划分 Stream,还可以动态装配这些 Stream,以便获得需要的流。假如你想要获得一个具有缓冲的文件输入字节流,这样即可。
import java.io.BufferedInputStream; import java.io.FileInputStream; import java.io.InputStream; public class IOTest3 { public static void main(String[] args) throws Exception { InputStream fis = new FileInputStream("test.txt"); BufferedInputStream bis = new BufferedInputStream(fis); } }
流分类:
-
字节流。InputStream 是所有字节输入流的基类,而 OutputStream 是所有字节输出流的基类。
-
字符流。Reader 是所有读取字符串输入流的基类,而 Writer 是所有输出字符串的基类。
另外 InputStream,OutputStream,Reader,Writer 都是抽象类。
字节流是最基本的,所有的 InputStream 和 OutputStream 的子类都是字节流,主要用来处理二进制数据,它是按字节来处理的,但实际中很多的数据是文本,所以又提出了字符流的概念,它是按虚拟机的 Encode 来处理,也就是要按照字符集将字节转化为字符。Java 中默认的编码是 Unicode 编码。
字节流和字符流通过 InputStreamReader,OutputStreamWriter 来关联,实际上是通过 byte[ ] 和 String 来关联。在实际开发中出现的汉字问题实际上都是在字符流和字节流之间转化不统一而造成的。在从字节流转化为字符流时,实际上就是 byte[ ] 转化为 String
byte[] bytes = new byte[10]; String charsetName = "UTF-8" String s1 = new String(bytes, charsetName);
有一个关键的参数字符集编码,通常我们都省略了,而在字符流转化为字节流时,实际上是 String 转化为 byte[ ]
String s = "你好"; byte[] bytes = s.getBytes();
至于其他的流,主要是为了提高性能和使用方便,如:
// 字节流相关 FileInputStream FileOutputStream BufferedInputStream BufferedOutputStream // 字符流相关 FileReader FilterWriter BufferedReader BufferedWriter
字节流和字符流的区别,除了类名称的区别,还有就是字符流会使用缓冲区,而字节流没有使用缓冲区。
缓冲区可以简单地理解为一段特殊的内存。某些情况下,如果一个程序频繁地操作一个资源(如文件或数据库),则性能会很低,此时为了提升性能,就可以将一部分数据暂时读入到内存的一块区域之中,以后直接从此区域中读取数据即可,因为读取内存速度会比较快,这样可以提升程序的性能。
在字符流的操作中,所有的字符都是在内存中形成的,在输出前会将所有的内容暂时保存在内存之中,所以使用缓冲区暂存数据。如果想在不关闭时也可以将字符流的内容全部输出,则可以使用 Writer 类中的 flush() 方法。
字节流和字符流的选择
Reader 类的 read() 方法返回类型为 int,面向的是字符(占两个字节共 16 位),范围在 0 到 65535 之间 ( 0x00 - 0xffff ),如果已到达流的末尾,则返回 -1。
InputStream 的 read() 方法虽然也返回 int,但由于此类是面向字节流的,一个字节占 8 位,所以返回 0 到 255 范围内的 int 字节值。如果因为已经到达流末尾而没有可用的字节,则返回值 -1。因此对于不能用 0 - 255 来表示的值就得用字符流来读取,比如说汉字。
字符( Reader 和 Writer ):中文,字符是只有在内存中才会形成的,操作字符,字符数组或字符串。
字节( InputStream 和 OutputStream ):音频文件,图片,歌曲,所有的硬盘上保存文件或进行传输的时候,操作字节和字节数组或二进制对象。
最后来看一个例子,实现拷贝功能。代码只是为了演示操作,合理的写法不该这样。
public static void main(String[] args) throws Exception { File inFile = new File("D:\\input.txt"); File outFile = new File("D:\\output.txt"); FileInputStream inputStream = new FileInputStream(inFile); FileOutputStream outputStream = new FileOutputStream(outFile); byte[] content = new byte[1024]; int len; while ((len = inputStream.read(content)) != -1) { outputStream.write(content, 0, len); } outputStream.flush(); outputStream.close(); inputStream.close(); }