字节流与字符流详解
字节流与字符流
先来看一下流的概念:
在程序中所有的数据都是以流的方式进行传输或保存的,程序需要数据的时候要使用输入流读取数据,而当程序需要将一些数据保存起来的时候,就要使用输出流完成。
程序中的输入输出都是以流的形式保存的,流中保存的实际上全都是字节文件。
字节流与字符流
在java.io包中操作文件内容的主要有两大类:字节流、字符流,两类都分为输入和输出操作。在字节流中输出数据主要是使用OutputStream完成,输入使的是InputStream,在字符流中输出主要是使用Writer类完成,输入流主要使用Reader类完成。(这四个都是抽象类)
java中提供了专用于输入输出功能的包Java.io,其中包括:
InputStream,OutputStream,Reader,Writer
InputStream 和OutputStream,两个是为字节流设计的,主要用来处理字节或二进制对象,
Reader和 Writer.两个是为字符流(一个字符占两个字节)设计的,主要用来处理字符或字符串.
字符流处理的单元为2个字节的Unicode字符,分别操作字符、字符数组或字符串,而字节流处理单元为1个字节,操作字节和字节数组。所以字符流是由Java虚拟机将字节转化为2个字节的Unicode字符为单位的字符而成的,所以它对多国语言支持性比较好!如果是音频文件、图片、歌曲,就用字节流好点,如果是关系到中文(文本)的,用字符流好点
所有文件的储存是都是字节(byte)的储存,在磁盘上保留的并不是文件的字符而是先把字符编码成字节,再储存这些字节到磁盘。在读取文件(特别是文本文件)时,也是一个字节一个字节地读取以形成字节序列
字节流可用于任何类型的对象,包括二进制对象,而字符流只能处理字符或者字符串; 2. 字节流提供了处理任何类型的IO操作的功能,但它不能直接处理Unicode字符,而字符流就可以
字节流是最基本的,所有的InputStrem和OutputStream的子类都是,主要用在处理二进制数据,它是按字节来处理的 但实际中很多的数据是文本,又提出了字符流的概念,它是按虚拟机的encode来处理,也就是要进行字符集的转化 这两个之间通过 InputStreamReader,OutputStreamWriter来关联,实际上是通过byte[]和String来关联 在实际开发中出现的汉字问题实际上都是在字符流和字节流之间转化不统一而造成的
==================我们还可以看到:============
Reader类的read()方法返回类型为int :作为整数读取的字符(占两个字节共16位),范围在 0 到 65535 之间 (0x00-0xffff),如果已到达流的末尾,则返回 -1
inputStream的read()虽然也返回int,但由于此类是面向字节流的,一个字节占8个位,所以返回 0 到 255 范围内的 int 字节值。如果因为已经到达流末尾而没有可用的字节,则返回值 -1。因此对于不能用0-255来表示的值就得用字符流来读取!比如说汉字.
操作流程
在Java中IO操作也是有相应步骤的,以文件操作为例,主要的操作流程如下:
1 使用File类打开一个文件
2 通过字节流或字符流的子类,指定输出的位置
3 进行读/写操作
4 关闭输入/输出
IO操作属于资源操作,一定要记得关闭
字节流
字节流主要是操作byte类型数据,以byte数组为准,主要操作类就是OutputStream、InputStream
字节输出流:OutputStream
OutputStream是整个IO包中字节输出流的最大父类,此类的定义如下:
public abstract class OutputStream extends Object implements Closeable,Flushable
从以上的定义可以发现,此类是一个抽象类,如果想要使用此类的话,则首先必须通过子类实例化对象,那么如果现在要操作的是一个文件,则可以使用:FileOutputStream类。通过向上转型之后,可以为OutputStream实例化
Closeable表示可以关闭的操作,因为程序运行到最后肯定要关闭
Flushable:表示刷新,清空内存中的数据
FileOutputStream类的构造方法如下:
public FileOutputStream(File file)throws FileNotFoundException
写数据:
1 import java.io.File; 2 import java.io.FileOutputStream; 3 import java.io.IOException; 4 import java.io.OutputStream; 5 6 public class Test11 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 OutputStream out=new FileOutputStream(f);//如果文件不存在会自动创建 10 String str="Hello World"; 11 byte[] b=str.getBytes(); 12 out.write(b);//因为是字节流,所以要转化成字节数组进行输出 13 out.close(); 14 } 15 }
也可以一个字节一个字节进行输出,如下:
1 import java.io.File; 2 import java.io.FileOutputStream; 3 import java.io.IOException; 4 import java.io.OutputStream; 5 6 public class Test11 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 OutputStream out=new FileOutputStream(f);//如果文件不存在会自动创建 10 String str="Hello World"; 11 byte[] b=str.getBytes(); 12 for(int i=0;i<b.length;i++){ 13 out.write(b[i]); 14 } 15 out.close(); 16 } 17 }
以上输出只会进行覆盖,如果要追加的话,请看FileOutputStream类的另一个构造方法:
public FileOutputStream(File file,boolean append)throws FileNotFoundException
在构造方法中,如果将append的值设置为true,则表示在文件的末尾追加内容。
1 import java.io.File; 2 import java.io.FileOutputStream; 3 import java.io.IOException; 4 import java.io.OutputStream; 5 6 public class Test11 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 OutputStream out=new FileOutputStream(f,true);//追加内容 10 String str="\r\nHello World"; 11 byte[] b=str.getBytes(); 12 for(int i=0;i<b.length;i++){ 13 out.write(b[i]); 14 } 15 out.close(); 16 } 17 }
文件中换行为:\r\n
字节输入流:InputStream
既然程序可以向文件中写入内容,则就可以通过InputStream从文件中把内容读取进来,首先来看InputStream类的定义:
public abstract class InputStream extends Object implements Closeable
与OutputStream类一样,InputStream本身也是一个抽象类,必须依靠其子类,如果现在是从文件中读取,就用FileInputStream来实现。
观察FileInputStream类的构造方法:
public FileInputStream(File file)throws FileNotFoundException
读文件:
1 import java.io.File; 2 import java.io.FileInputStream; 3 import java.io.IOException; 4 import java.io.InputStream; 5 6 public class Test12 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 InputStream in=new FileInputStream(f); 10 byte[] b=new byte[1024]; 11 int len=in.read(b); 12 in.close(); 13 System.out.println(new String(b,0,len)); 14 } 15 }
但以上方法是有问题的,用不用开辟这么大的一个字节数组,明显是浪费嘛,我们可以根据文件的大小来定义字节数组的大小,File类中的方法:public long length()
1 import java.io.File; 2 import java.io.FileInputStream; 3 import java.io.IOException; 4 import java.io.InputStream; 5 6 public class Test13 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 InputStream in=new FileInputStream(f); 10 byte[] b=new byte[(int) f.length()]; 11 in.read(b); 12 in.close(); 13 System.out.println(new String(b)); 14 } 15 }
我们换种方式,一个字节一个字节读入~
1 import java.io.File; 2 import java.io.FileInputStream; 3 import java.io.IOException; 4 import java.io.InputStream; 5 6 public class Test14 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 InputStream in=new FileInputStream(f); 10 byte[] b=new byte[(int) f.length()]; 11 for(int i=0;i<b.length;i++){ 12 b[i]=(byte) in.read(); 13 } 14 in.close(); 15 System.out.println(new String(b)); 16 } 17 }
但以上情况只适合知道输入文件的大小,不知道的话用如下方法:
1 import java.io.File; 2 import java.io.FileInputStream; 3 import java.io.IOException; 4 import java.io.InputStream; 5 6 public class Test15 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 InputStream in=new FileInputStream(f); 10 byte[] b=new byte[1024]; 11 int temp=0; 12 int len=0; 13 while((temp=in.read())!=-1){//-1为文件读完的标志 14 b[len]=(byte) temp; 15 len++; 16 } 17 in.close(); 18 System.out.println(new String(b,0,len)); 19 } 20 }
字符流
在程序中一个字符等于两个字节,那么java提供了Reader、Writer两个专门操作字符流的类。
字符输出流:Writer
Writer本身是一个字符流的输出类,此类的定义如下:
public abstract class Writer extends Object implements Appendable,Closeable,Flushable
此类本身也是一个抽象类,如果要使用此类,则肯定要使用其子类,此时如果是向文件中写入内容,所以应该使用FileWriter的子类。
FileWriter类的构造方法定义如下:
public FileWriter(File file)throws IOException
字符流的操作比字节流操作好在一点,就是可以直接输出字符串了,不用再像之前那样进行转换操作了。
写文件:
1 import java.io.File; 2 import java.io.FileWriter; 3 import java.io.IOException; 4 import java.io.Writer; 5 6 public class Test16 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 Writer out=new FileWriter(f); 10 String str="Hello World"; 11 out.write(str); 12 out.close(); 13 } 14 }
在默认情况下再次输出会覆盖,追加的方法也是在构造函数上加上追加标记
1 import java.io.File; 2 import java.io.FileWriter; 3 import java.io.IOException; 4 import java.io.Writer; 5 6 public class Test17 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 Writer out=new FileWriter(f,true);//追加 10 String str="\r\nHello World"; 11 out.write(str); 12 out.close(); 13 } 14 }
字符输入流:Reader
Reader是使用字符的方式从文件中取出数据,Reader类的定义如下:
public abstract class Reader extends Objects implements Readable,Closeable
Reader本身也是抽象类,如果现在要从文件中读取内容,则可以直接使用FileReader子类。
FileReader的构造方法定义如下:
public FileReader(File file)throws FileNotFoundException
以字符数组的形式读取出数据:
1 import java.io.File; 2 import java.io.FileReader; 3 import java.io.IOException; 4 import java.io.Reader; 5 6 public class Test18 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 Reader input=new FileReader(f); 10 char[] c=new char[1024]; 11 int len=input.read(c); 12 input.close(); 13 System.out.println(new String(c,0,len)); 14 } 15 }
也可以用循环方式,判断是否读到底:
1 import java.io.File; 2 import java.io.FileReader; 3 import java.io.IOException; 4 import java.io.Reader; 5 6 public class Test19 { 7 public static void main(String[] args) throws IOException { 8 File f = new File("d:" + File.separator+"test.txt"); 9 Reader input=new FileReader(f); 10 char[] c=new char[1024]; 11 int temp=0; 12 int len=0; 13 while((temp=input.read())!=-1){ 14 c[len]=(char) temp; 15 len++; 16 } 17 input.close(); 18 System.out.println(new String(c,0,len)); 19 } 20 }
字节流与字符流的区别
字节流和字符流使用是非常相似的,那么除了操作代码的不同之外,还有哪些不同呢?
字节流在操作的时候本身是不会用到缓冲区(内存)的,是与文件本身直接操作的,而字符流在操作的时候是使用到缓冲区的
字节流在操作文件时,即使不关闭资源(close方法),文件也能输出,但是如果字符流不使用close方法的话,则不会输出任何内容,说明字符流用的是缓冲区,并且可以使用flush方法强制进行刷新缓冲区,这时才能在不close的情况下输出内容
那开发中究竟用字节流好还是用字符流好呢?
在所有的硬盘上保存文件或进行传输的时候都是以字节的方法进行的,包括图片也是按字节完成,而字符是只有在内存中才会形成的,所以使用字节的操作是最多的。
如果要java程序实现一个拷贝功能,应该选用字节流进行操作(可能拷贝的是图片),并且采用边读边写的方式(节省内存)。