JavaSE学习笔记(二十七)—— 字符流
一、字符流概述
【字符流是什么】
字符流:就是在字节流的基础上,加上编码,形成的数据流。即,字符流=字节流+编码表。
【为什么要使用字符流】
既然字节流提供了能够处理任何类型的输入/输出操作的功能,那为什么还要存在字符流呢?
因为使用字节流操作汉字或特殊符号语言的时候容易乱码,比如我要将a.txt的文本内容读取到控制台上打印:
public class FileInputStreamDemo { public static void main(String[] args) throws IOException { // 创建字节输入流对象 FileInputStream fis = new FileInputStream("a.txt"); // 读取数据 byte[] bys = new byte[1024]; int len = 0; while ((len = fis.read(bys)) != -1) { System.out.println(new String(bys, 0, len)); } // 释放资源 fis.close(); } }
控制台打印的结果为:
可以看出出现了大量的中文乱码问题。乱码的原因如下:
因为字节流不能直接操作Unicode字符,字节流一次只能操作一个字节。GBK每个汉字两个字节,UTF-8每个汉字三个字节,假如在接收一个中文字符时,只接收了中文字符的一个字节就开始输出,那么那个中文字符就会失帧,所以就会乱码。如果是输出到指定文件,就不用担心此问题,因为文件都是全部接收完毕后才打开新生成的文件。因此就保证了数据的全部接收。
【什么时候使用字符流】
如果数据所在的文件通过windows自带的记事本打开并能读懂里面的内容,操作二进制文件(比如图片、音频、视频)必须使用字节流。
二、编码表
2.1 编码表的由来
计算机只能识别二进制数据,早期由来是电信号。为了方便应用计算机,让它可以识别各个国家的文字。就将各个国家的文字用数字来表示,并一一对应,形成一张表。这就是编码表。
2.2 常见的编码表
ASCII:美国标准信息交换码。用一个字节的7位可以表示。其中最高位为符号为,其余为数值位
'a' 97
'A' 65
'0' 48
ISO8859-1:拉丁码表。欧洲码表。用一个字节的8位表示。
GB2312:中国的中文编码表。
GBK:中国的中文编码表升级,融合了更多的中文文字符号。
GB18030:GBK的取代版本。
Unicode:国际标准码,融合了多种文字。所有文字都用两个字节来表示,Java语言使用的就是unicode
UTF-8:最多用三个字节来表示一个字符。能用一个的就用一个(ASCII兼容);一个表示不了的就用两个;实在不行就用三个。
2.3 字符串中的编码问题
- 编码:把看得懂的变成看不懂的
byte[] getBytes(String charsetName):使用指定的字符集合把字符串编码为字节数组
- 解码:把看不懂的变成看得懂的
String(byte[] bytes, String charsetName):通过指定的字符集解码字节数组
编码问题简单,只要编码解码的格式是一致的。
public class StringDemo { public static void main(String[] args) throws UnsupportedEncodingException { String s = "你好"; // String -- byte[] byte[] bys = s.getBytes(); // [-60, -29, -70, -61] // byte[] bys = s.getBytes("GBK");// [-60, -29, -70, -61] // byte[] bys = s.getBytes("UTF-8");// [-28, -67, -96, -27, -91, -67] System.out.println(Arrays.toString(bys)); // byte[] -- String String ss = new String(bys); // 你好 // String ss = new String(bys, "GBK"); // 你好 // String ss = new String(bys, "UTF-8"); // ??? System.out.println(ss); } }
三、转换流
3.1 OutputStreamWriter
OutputStreamWriter:把字节输出流转换为字符输出流。是字符到字节的桥梁。编码。
【构造方法】
OutputStreamWriter(OutputStream out):根据默认编码把字节流的数据转换为字符流
OutputStreamWriter(OutputStream out,String charsetName):根据指定编码把字节流数据转换为字符流
public class OutputStreamWriterDemo { public static void main(String[] args) throws IOException { // 创建对象 // OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("osw.txt"));//默认GBK // OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("osw.txt"), "GBK");//指定GBK OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("osw.txt"), "UTF-8");//指定UTF-8 // 写数据 osw.write("中国"); // 释放资源 osw.close(); } }
【写数据的方法】
public void write(int c):写一个字符
public void write(char[] cbuf):写一个字符数组
public void write(char[] cbuf,int off,int len):写一个字符数组的一部分
public void write(String str):写一个字符串
public void write(String str,int off,int len):写一个字符串的一部分
public class OutputStreamWriterDemo { public static void main(String[] args) throws IOException { // 创建对象 OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("osw2.txt")); // 写数据 // public void write(int c):写一个字符 // osw.write('a'); // osw.write(97); // public void write(char[] cbuf):写一个字符数组 // char[] chs = {'a','b','c','d','e'}; // osw.write(chs); // public void write(char[] cbuf,int off,int len):写一个字符数组的一部分 // osw.write(chs, 1, 3); // public void write(String str):写一个字符串 // osw.write("我爱林青霞"); // public void write(String str,int off,int len):写一个字符串的一部分 osw.write("我爱林青霞", 2, 3); // 刷新缓冲区 osw.flush(); // 释放资源 osw.close(); } }
close()和flush()的区别?
A:close()关闭流对象,但是先刷新一次缓冲区。关闭之后,流对象不可以继续再使用了。
B:flush()仅仅刷新缓冲区,刷新之后,流对象还可以继续使用。
3.2 InputStreamReader
InputStreamReader:把字节输入流转换为字符输入流。是字节到字符的桥梁。解码。
【构造方法】
InputStreamReader(InputStream is):用默认的编码读取数据
InputStreamReader(InputStream is,String charsetName):用指定的编码读取数据
public class InputStreamReaderDemo { public static void main(String[] args) throws IOException { // 创建对象 // InputStreamReader isr = new InputStreamReader(new FileInputStream("osw.txt")); // InputStreamReader isr = new InputStreamReader(new FileInputStream("osw.txt"),"GBK"); InputStreamReader isr = new InputStreamReader(new FileInputStream("osw.txt"),"UTF-8"); // 读取数据 // 一次读取一个字符 int ch = 0; while ((ch = isr.read()) != -1) { System.out.print((char)ch); } // 释放资源 isr.close(); } }
【写数据的方法】
int read():一次读取一个字符
int read(char[] chs):一次读取一个字符数组
public class InputStreamReaderDemo { public static void main(String[] args) throws IOException { // 创建对象 InputStreamReader isr = new InputStreamReader(new FileInputStream( "StringDemo.java")); // 一次读取一个字符 // int ch = 0; // while ((ch = isr.read()) != -1) { // System.out.print((char) ch); // } // 一次读取一个字符数组 char[] chs = new char[1024]; int len = 0; while ((len = isr.read(chs)) != -1) { System.out.print(new String(chs, 0, len)); } // 释放资源 isr.close(); } }
【练习】
需求:把当前项目目录下的a.txt内容复制到当前项目目录下的b.txt中
/** * 数据源: * a.txt -- 读取数据 -- 字符转换流 -- InputStreamReader * 目的地: * b.txt -- 写出数据 -- 字符转换流 -- OutputStreamWriter */ public class CopyFileDemo { public static void main(String[] args) throws IOException { // 封装数据源 InputStreamReader isr = new InputStreamReader(new FileInputStream("a.txt")); // 封装目的地 OutputStreamWriter osw = new OutputStreamWriter(new FileOutputStream("b.txt")); // 读写数据 // 方式1:一次读取一个字节 /*int ch = 0; while ((ch = isr.read()) != -1) { osw.write(ch); }*/ // 方式2:一次读取一个字节数组 char[] chs = new char[1024]; int len = 0; while ((len = isr.read(chs)) != -1) { osw.write(chs, 0, len); // osw.flush(); } // 释放资源 osw.close(); isr.close(); } }
3.3 FileWriter/FileReader
由于我们常见的操作都是使用本地默认编码,所以,不用指定编码。
而转换流的名称有点长,所以,Java就提供了其子类供我们使用。
OutputStreamWriter = FileOutputStream + 编码表(GBK)
FileWriter = FileOutputStream + 编码表(GBK)
InputStreamReader = FileInputStream + 编码表(GBK)
FileReader = FileInputStream + 编码表(GBK)
/* * 需求:把当前项目目录下的a.txt内容复制到当前项目目录下的b.txt中 * * 数据源: * a.txt -- 读取数据 -- 字符转换流 -- InputStreamReader -- FileReader * 目的地: * b.txt -- 写出数据 -- 字符转换流 -- OutputStreamWriter -- FileWriter */ public class CopyFileDemo2 { public static void main(String[] args) throws IOException { // 封装数据源 FileReader fr = new FileReader("a.txt"); // 封装目的地 FileWriter fw = new FileWriter("b.txt"); // 一次一个字符 // int ch = 0; // while ((ch = fr.read()) != -1) { // fw.write(ch); // } // 一次一个字符数组 char[] chs = new char[1024]; int len = 0; while ((len = fr.read(chs)) != -1) { fw.write(chs, 0, len); fw.flush(); } // 释放资源 fw.close(); fr.close(); } }
四、字符缓冲流
4.1 BufferedWriter
字符流为了高效读写,也提供了对应的字符缓冲流。
- BufferedWriter:字符缓冲输出流
- BufferedReader:字符缓冲输入流
其中BufferedWriter是将文本写入字符输出流,缓冲各个字符,从而提供单个字符、数组和字符串的高效写入。 可以指定缓冲区的大小,或者接受默认的大小。在大多数情况下,默认值就足够大了。
public class BufferedWriterDemo { public static void main(String[] args) throws IOException { // BufferedWriter(Writer out) // BufferedWriter bw = new BufferedWriter(new OutputStreamWriter(new FileOutputStream("bw.txt"))); BufferedWriter bw = new BufferedWriter(new FileWriter("bw.txt")); bw.write("hello"); bw.write("world"); bw.write("java"); bw.flush(); bw.close(); } }
4.2 BufferedReader
BufferedReader:从字符输入流中读取文本,缓冲各个字符,从而实现字符、数组和行的高效读取。 可以指定缓冲区的大小,或者可使用默认的大小。大多数情况下,默认值就足够大了。
构造方法:BufferedReader(Reader in)
public class BufferedReaderDemo { public static void main(String[] args) throws IOException { // 创建字符缓冲输入流对象 BufferedReader br = new BufferedReader(new FileReader("bw.txt")); // 方式1 /*int ch = 0; while ((ch = br.read()) != -1) { System.out.print((char) ch); }*/ // 方式2 char[] chs = new char[1024]; int len = 0; while ((len = br.read(chs)) != -1) { System.out.print(new String(chs, 0, len)); } // 释放资源 br.close(); } }
4.3 字符缓冲流的特殊方法
BufferedWriter:
public void newLine():根据系统来决定换行符
BufferedReader:
public String readLine():一次读取一行数据。包含该行内容的字符串,不包含任何行终止符,如果已到达流末尾,则返回 null
public class BufferedDemo { public static void main(String[] args) throws IOException { // write(); read(); } private static void read() throws IOException { // 创建字符缓冲输入流对象 BufferedReader br = new BufferedReader(new FileReader("bw2.txt")); // public String readLine():一次读取一行数据 /*String line = br.readLine(); System.out.println(line); line = br.readLine(); System.out.println(line);*/ // 最终版代码 String line = null; while ((line = br.readLine()) != null) { System.out.println(line); } // 释放资源 br.close(); } private static void write() throws IOException { // 创建字符缓冲输出流对象 BufferedWriter bw = new BufferedWriter(new FileWriter("bw2.txt")); for (int x = 0; x < 10; x++) { bw.write("hello" + x); bw.newLine(); bw.flush(); } // 释放资源 bw.close(); } }
【练习】
需求:把当前项目目录下的a.txt内容复制到当前项目目录下的b.txt中
/** * 数据源: * a.txt -- 读取数据 -- 字符转换流 -- InputStreamReader -- FileReader -- BufferedReader * 目的地: * b.txt -- 写出数据 -- 字符转换流 -- OutputStreamWriter -- FileWriter -- BufferedWriter */ public class CopyFileDemo2 { public static void main(String[] args) throws IOException { // 封装数据源 BufferedReader br = new BufferedReader(new FileReader("a.txt")); // 封装目的地 BufferedWriter bw = new BufferedWriter(new FileWriter("b.txt")); /*char[] chs = new char[1024]; int len = 0; while ((len = br.read(chs)) != -1) { bw.write(chs, 0, len); bw.flush(); }*/ // 读写数据 String line = null; while ((line = br.readLine()) != null) { bw.write(line); bw.newLine(); bw.flush(); } // 释放资源 bw.close(); br.close(); } }