Java开发笔记(八十六)通过缓冲区读写文件

前面介绍了利用文件写入器和文件读取器来读写文件,因为FileWriter与FileReader读写的数据以字符为单位,所以这种读写文件的方式被称作“字符流I/O”,其中字母I代表输入Input,字母O代表输出Output。可是FileWriter的读操作并不高效,缘由在于FileWriter每次调用write方法都会直接写入文件,假如某项业务需要多次调用write方法,那么程序就会写入文件同样次数。因为写文件本质是写磁盘,磁盘的速度远不如内存,所以频繁地写文件必然严重降低程序的运行效率。为此Java又设计了缓存写入器BufferedWriter,它的write方法并不直接写入文件,而是先写入一块缓存,等到缓存写满了再将缓存上的数据写入文件。由于缓存空间位于内存之中,写入缓存等同访问内存,这样相当于把写磁盘动作替换成写内存动作,因此BufferedWriter的整体写文件性能要大大优于FileWriter。除此之外,BufferedWriter还新增了下列几个方法:
newLine:往文件末尾添加换行标记(Window系统是回车加换行)。当然实际上是先往缓存添加换行标记,并非直接往磁盘写入换行标记。
flush:立即将缓冲区中的数据写入磁盘。默认情况要等缓冲区满了才会写入磁盘,或者调用close方法关闭文件之时也会写入磁盘,但是有时程序猴急,一定要立即写入磁盘,此时就需调用flush方法强行写磁盘。
使用缓存写入器之前要先创建文件读取器对象,并获得父类Writer的实例,然后再据此创建缓存写入器对象。下面是通过缓存写入器把多行字符串写入文件的代码例子:

	private static String mSrcName = "D:/test/aad.txt";
	// 使用缓存字符流写入文件
	private static void writeBuffer() {
		String str1 = "白日依山尽,黄河入海流。";
		String str2 = "欲穷千里目,更上一层楼。";
		File file = new File(mSrcName); // 创建一个指定路径的文件对象
		// try(...)允许在圆括号内部拥有多个资源创建语句,语句之间以冒号分隔
		// 先创建文件写入器,再根据文件读取器创建缓存写入器
		try (Writer writer = new FileWriter(file);
				BufferedWriter bwriter = new BufferedWriter(writer);) {
			// FileWriter的每次write调用都会直接写入磁盘,不但效率低,性能也差。
			// BufferedWriter的每次write调用会先写入缓冲区,直到缓冲区满了才写入磁盘,
			// 缓冲区大小默认是8K,查看源码defaultCharBufferSize = 8192;
			// 资源释放的close方法再把缓冲区的剩余数据写入磁盘,
			// 或者中途调用flush方法也可提前将缓冲区的数据写入磁盘。
			bwriter.write(str1); // 往文件写入字符串
			bwriter.newLine(); // 另起一行,也就是在文件末尾添加换行标记(Window系统是回车加换行)
			bwriter.write(str2);  // 往文件写入字符串
			//bwriter.flush(); // 把缓冲区中的数据写入磁盘
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

 

既然文件写入器有对应的缓存写入器,那么文件读取器也有对应的缓存读取器BufferedReader。BufferedReader的实现原理与它的兄弟BufferedWriter类似,另外BufferedReader比起文件读取器新增了如下方法:
readLine:从文件中读取一行数据。
mark:在当前位置做个标记。
reset:重置文件指针,令其回到上次标记的位置。也就是回到上次mark方法标记的文件位置。
lines:读取文件内容的所有行,返回的是Stream<String>流对象,之后便可按照流式处理来加工该字符串流。
若想使用缓存读取器,依然要先创建文件读取器,再根据其父类的读取器实例创建缓存读取器。下面是通过缓存读取器从文件中读取多行字符串的代码例子:

	// 使用缓存字符流读取文件
	private static void readBuffer() {
		File file = new File(mSrcName); // 创建一个指定路径的文件对象
		// try(...)允许在圆括号内部拥有多个资源创建语句,语句之间以冒号分隔
		// 先创建文件读取器,再根据文件读取器创建缓存读取器
		try (Reader reader = new FileReader(file);
				BufferedReader breader = new BufferedReader(reader);) {
			breader.mark((int) file.length()); // 做个标记
			for (int i=1; ; i++) {
				// FileReader只能一个字符一个字符地读,或者一次性读进字符数组。
				// BufferedReader还支持一行一行地读。
				String line = breader.readLine(); // 从文件中读出一行文字
				if (line == null) { // 读到了空指针,表示已经到了文件末尾
					break;
				}
				System.out.println("第"+i+"行的文字为:"+line);
			}
			breader.reset(); // 重置文件指针,令其回到上次标记的位置
			for (int i=1; ; i++) {
				String line = breader.readLine(); // 从文件中读出一行文字
				if (line == null) { // 读到了空指针,表示已经到了文件末尾
					break;
				}
				System.out.println("又读了一遍 第"+i+"行的文字为:"+line);
			}
			//breader.lines(); // 返回Stream<String>对象,之后可按照流式处理来加工该字符串流
		} catch (Exception e) {
			e.printStackTrace();
		}
	}

 

注意到以上代码BufferedWriter和BufferedReader的创建语句都位于try后面的圆括号之中,这是因为Writer与Reader两大家族统统实现了AutoCloseable接口,所以由它们繁衍而来的所有子类都具备自动释放资源的功能。另外,try语句支持同时管理多个资源类,只要它们的对象创建语句以冒号隔开,程序在运行时即可自动回收相关的资源。
结合运用读操作和写操作,可以实现文件复制的功能,无非是一边从源文件中读出数据,另一边紧接着往目标文件写入数据。采用缓存读取器和缓存写入器逐行复制的话,具体的文件复制代码示例如下:

	private static String mSrcName = "D:/test/aad.txt";
	private static String mDestName = "D:/test/aad_copy.txt";
	// 通过缓存字符流逐行复制文件
	private static void copyFile() {
		File src = new File(mSrcName); // 创建一个指定路径的源文件对象
		File dest = new File(mDestName); // 创建一个指定路径的目标文件对象
		// try(...)允许在圆括号内部拥有多个资源创建语句,语句之间以冒号分隔
		// 分别创建源文件的缓存读取器,以及目标文件的缓存写入器
		try (BufferedReader breader = new BufferedReader(new FileReader(src));
				BufferedWriter bwriter = new BufferedWriter(new FileWriter(dest));) {
			for (int i=0; ; i++) {
				String line = breader.readLine(); // 从文件中读出一行文字
				if (line == null) { // 读到了空指针,表示已经到了文件末尾
					break;
				}
				if (i != 0) { // 第一行开头不用换行
					bwriter.newLine(); // 另起一行,也就是在文件末尾添加换行标记
				}
				bwriter.write(line); // 往文件写入字符串
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
		System.out.println("文件复制完成,源文件大小="+src.length()+",新文件大小="+dest.length());
	}

 

或者也可逐个字符来复制文件,此时BufferedReader每次调用的read方法只返回整型数表示一个字符,并且BufferedWriter每次调用的write方法也只写入该字符对应的整型数。通过依次遍历源文件的所有字符,同时往目标文件依次写入这些字符,从而完成逐个字符复制文件的操作流程。下面是采取逐字符复制文件的代码例子:

	// 通过缓存字符流逐个字符复制文件
	private static void copyFileByInt() {
		File src = new File(mSrcName); // 创建一个指定路径的源文件对象
		File dest = new File(mDestName); // 创建一个指定路径的目标文件对象
		// try(...)允许在圆括号内部拥有多个资源创建语句,语句之间以冒号分隔
		// 分别创建源文件的缓存读取器,以及目标文件的缓存写入器
		try (BufferedReader breader = new BufferedReader(new FileReader(src));
				BufferedWriter bwriter = new BufferedWriter(new FileWriter(dest));) {
			while (true) { // 开始遍历文件中的所有字符
				int temp = breader.read(); // 从源文件中读出一个字符
				if (temp == -1) { // read方法返回-1表示已经读到了文件末尾
					break;
				}
				bwriter.write(temp); // 往目标文件写入一个字符
			}
		} catch (Exception e) {
			e.printStackTrace();
		}
		System.out.println("文件复制完成,源文件大小="+src.length()+",新文件大小="+dest.length());
	}

 

需要注意的是,使用字符流复制文件只有逐行复制和逐字符复制两种方式,不可采取整个读到字符数组再整个写入字符数组的方式。之所以不能通过字符数组复制文件,是因为中文跟英文不一样,一个汉字会占用多个字节(GBK编码的每个汉字占用两个字节,UTF8编码的每个汉字占用三个字节)。若要把文件内容读到字符数组,势必先得知晓该数组的长度,可是调用文件对象的length方法只能得到该文件的字节长度,并非字符长度。譬如“白日依山尽”这个字符串在内存中的字符数组长度为5,写到UTF8编码的文件之后,文件大小是5*3=15字节;接着想把文件内容读到字符数组,然而15字节的文件天晓得它有几个字符,可能有5个UTF8编码的中文字符,也可能有15个英文字符,也可能有5个GBK编码的中文字符加5个英文字符共10个字符,总之你根本想不到该分配多大的字符数组。既然确定不了待读取的字符数组长度,就无法一字不差地复制文件内容了。



更多Java技术文章参见《Java开发笔记(序)章节目录

posted @ 2019-04-17 21:58  pinlantu  阅读(2997)  评论(1编辑  收藏  举报