IO流详解之字节流与编码方式

IO流

1.流的概念和分类

IO流核心组成
- 核心组成：一个类（File）、一个接口（Serializable）、四个抽象类（InputStream/OutputStream、Reader/Writer）

什么是流
- 流：内存与存储设备之间传输数据的通道
流的分类
按方向
- 输入流：将<存储设备>中的内容读到<内存>中
- 输出流：将<内存>中的内容写到<存储设备>中
按单位
- 字节流：以字节为单位，可以读写所有数据
- 字符流：以字符为单位，只能读写文本数据
按功能
- 节点流：具有实际传输数据的读写功能
- 过滤流：在节点流的基础之上增强功能

2.字节流

2.1字节流抽象类

InputStream
- 此抽象类是表示字节输入流的所有类的父类。InputSteam是一个抽象类，它不可以实例化。数据的读取需要由它的子类来实现。根据节点的不同，它派生了不同的节点流子类。
- 继承自InputSteam的流都是用于向程序中输入数据，且数据的单位为字节（8 bit）
- 常用方法：
  
  public int read(){}：读取一个字节的数据，并将字节的值作为int类型返回（0-255之间的一个值）。如果未读出字节则返回-1（返回值为-1表示读取结束）。while((data=fis.read())!=-1)来判断读取文件是否结束。
  public int read(byte[] b){} ：从该输入流读取最多 b.length个字节的数据，并把读取的数据存放到b这个字符数组里面
  public int read(byte[] b, int off, int len){}
OutputStream
- 此抽象类是表示字节输出流的所有类的父类。输出流接收输出字节并将这些字节发送到某个目的地
  public void write(int n)：向目的地中写入一个字节
  public void write(byte[] b){} ：将 b.length个字节从指定的字节数组写入此文件输出流。
  public void write(byte[] b, int off, int len){}

2.2文件字节流

FileInputStream：
- public int read(byte[] b) // 从流中读取多个字节，将读到内容存入 b 数组，返回实际读到的字节数；如果达到文件的尾部，则返回 -1
FileOutputStream：
- public void write(byte[] b) // 一次写多个字节，将 b 数组中所有字节，写入输出流

2.21 文件字节输入流代码演示

package stream.demo01;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
/*
    FileInputStream 使用
    文件字节输入流

*/

public class FileInputStreamTest {
    public static void main(String[] args) throws IOException {
        // 1 创建FileInputStream 并指定文件路径
        FileInputStream fileInputStream = new FileInputStream("D:\\atext.txt");

        // 2 读取文件
        /*
         // 方式一：单字节读取
        int date=0;
        //int d1 = fileInputStream.read();  不可以在这里赋值给d1,不然就只是读了一个字节
        //必须加括号，不然不知道执行谁
        while ((date=fileInputStream.read())!=-1){
            System.out.print((char) date);
        }
        */
        // 方式二：一次读取多个字节（3）
        byte[] array=new byte[3];// 大小为3的缓存区
        /*
        int count = fileInputStream.read(array);
        //System.out.println((new String(array)));// 一次读3个
        String  s  = new String(array);
        System.out.println(s);

        int count2 = fileInputStream.read(array);
        System.out.println(new String(array));// 再读3个

        int count3=fileInputStream.read(array);
        System.out.println(new String(array));
*/

        // 上述优化后
        int count=0;
        //返回读取到了多少个元素，如果没有读取到返回-1
        while ((count=fileInputStream.read(array))!=-1){
            System.out.println(new String(array,0,count)); // new String(bytes, 0, count) 转换字符串从bytes的0下标开始，读count个字符串

        }
        // 3 关闭
        fileInputStream.close();
        System.out.println();
        System.out.println("执行完毕");

    }
}

运行结果

abc
def
gha
bcd
efg
hab
cde
fga
bcd
efg
hab
cde
fgh
abc
def
ghh
abc
def
gha
bcd
efg
h

执行完毕

2.22 文件字节输出流代码演示

package stream.demo01;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
/*
   文件输出流的使用
    FileOutputStream

*/

public class FileOutputStreamTest {
    public static void main(String[] args) throws IOException {
        // 1 创建文件字节输出流
        FileOutputStream fileOutputStream = new FileOutputStream("D:\\fff.txt",true);// true表示不覆盖 接着写
        /*
        // 2 写入文件
        fileOutputStream.write(97);
        fileOutputStream.write('b');
        fileOutputStream.write('c');
        fileOutputStream.write('d');
        fileOutputStream.write('e');
        */

        byte[] bytes = new byte[10];
        String st="hello world";
        fileOutputStream.write(st.getBytes());//getBytes():获取字节数据
        //getBytes（String charsetName）:使用指定的字符集将字符串编码为byte序列，并将结果存储到一个新的byte数组中


        // 3 关闭
        fileOutputStream.close();
        System.out.println("复制完成");
    }
}

运行结果

复制完成

fff

2.23 文件字节流复制文件代码演示

package stream.demo01;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;

//使用字节流实现文件的复制
public class StreamCopyTest {
    public static void main(String[] args) throws IOException {
        // 1 创建流
        // 1.1 文件字节输入流
        FileInputStream fis = new FileInputStream("D:\\a50.jpg");
        // 1.2 文件字节输出流
        FileOutputStream fos = new FileOutputStream("D:\\b50.jpg");

        // 2 边读边写
        byte[] bytes = new byte[1024*5];
        int count=0;
        while ((count=fis.read(bytes))!=-1){
            fos.write(bytes,0,count);
        }

        // 3 关闭
        fis.close();
        fos.close();
        System.out.println("执行完毕");
    }
}

运行结果

执行完毕

2.3 字节缓冲流

缓冲流：BufferedInputStream/ BufferedOutputStream
- 提高IO效率，减少访问磁盘次数
- 数据存储在缓冲区中，flush是将缓冲区的内容写入文件中，也可以直接close

2.31 字节缓冲输入流代码演示：

package stream.demo01;

import java.io.BufferedInputStream;
import java.io.FileInputStream;
// 字节缓冲流输入流
public class BufferedInputStreamTest {
    public static void main(String[] args) throws Exception {
        // 1 创建BufferedInputStream
        FileInputStream fis = new FileInputStream("D:\\atext.txt");
        BufferedInputStream bis = new BufferedInputStream(fis);// 目的是增强底层流的功能, 先读到缓冲区
                                                    //创建字节缓冲流对象时需要向其输入一个底层流
        /*
        // 2 读取
        int count=0;
        while ((count=bis.read())!=-1){
            System.out.print((char)count);
        }
        */
        // 用自己创建的缓冲流
        byte[] bytes = new byte[1024 * 5];
        int count=0;
        while ((count=bis.read(bytes))!=-1){
            System.out.println(new String(bytes,0,count));
        }
        // 3 关闭
        bis.close();

    }
}

运行结果

abcdefghabcdefghabcdefgabcdefghabcdefghabcdefghhabcdefghabcdefgh

2.32 字节缓冲输出流代码演示：

package stream.demo01;


import java.io.*;

// 使用字节缓冲流 写入 文件
public class BufferedOutputStreamTest {

    public static void main(String[] args) throws IOException {
        // 1 创建BufferedInputStream
        FileOutputStream fis = new FileOutputStream("D:\\buffer.txt");
        BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(fis);
        // 2 写入文件
        for (int i = 0; i < 10; i++) {// 此时读到了缓冲区，没有在文件中
            bufferedOutputStream.write("hello world\r\n".getBytes());//\r\n 转义字符换行打印

        }
        System.out.println("执行完毕");
        // 3 关闭    bos.flush(); // 刷新到硬盘   close方法里自带有
        bufferedOutputStream.close();

    }
}

运行结果

执行完毕

jieg

2.4 对象流

ObjectInputStream/ObiectOutputStream
- 增强了缓冲区功能
- 增强了读写 8 种基本数据类型和字符串功能
- 增强了读写对象的功能
  readObject()从流中读取一个对象
  writeObject(Object obj)向流中写入一个对象
- 使用流传输对象的过程称为序列化、反序列化
序列化对象类的书写注意事项
- 序列化类必须实现 Serializable 接口
- 序列化类中的对象属性要实现 Serializable 接口
- 序列化版本号ID，保证序列化的类和反序列化的类是同一个类private static final long serialVersionUID = 100L;
- 使用transient修饰属性，这个属性就不能序列化
- 静态属性不能序列化
- 序列化多个对象，可以借助集合来实现

2.41 序列化代码演示：

package stream.demo01;

import java.io.Serializable;

public class Student implements Serializable {
    //类要想序列化必须实现Serializable接口
    private String name;
   // private int age;
    private  transient int age;  //Student{name='zhangsan', age=0}
    //使用transient修饰属性，使属性不能被序列化

    public Student() {
    }

    public Student(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }
}

package stream.demo01;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectOutputStream;
import java.util.ArrayList;

// 使用objectoutputStream实现对象的序列化
//注意：在写对象这个类的时候需要public class Student implements Serializable实现这个接口。
/*
1.某个类要想序列化必须实现Serializable接口
2.序列化类中对象属性要求实现Serializable接口
3.序列化版本号ID，保证序列化的类和反序列化的类是同一个类
4.使用transient修饰属性，这个属性就不能序列化
5.静态属性不能序列化
6.序列化多个对象，可以借助集合来实现


*/

public class ObjectOutputStreamTest {
    public static void main(String[] args) throws IOException {
        // 1. 创建对象流
        FileOutputStream fos = new FileOutputStream("D:\\student.bin");//这里文件类型可以随便写，但是和反序列化一定要一致
        ObjectOutputStream obj = new ObjectOutputStream(fos);               //bin表示这是一个二进制文件类型
        // 2. 序列化（写入操作）
        Student s = new Student("zhangsan",18);
        Student lisi = new Student("lisi", 20);

        ArrayList<Student> Arry=new ArrayList<>();
        Arry.add(s);
        Arry.add(lisi);
        obj.writeObject(Arry);

//        obj.writeObject(s);
//        obj.writeObject(lisi);

        // 3. 关闭
        obj.close();
        System.out.println("序列化执行完毕");


    }
}

运行结果

序列化执行完毕

2.42 反序列化代码演示：

package stream.demo01;

import java.io.FileInputStream;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.util.ArrayList;
import java.util.Objects;

// 使用ObjectInputSteam实现反序列化（读取重构对象）
//反序列化（重构成对象）
public class ObjectInputStreamTest {
    public static <ArrrayList> void main(String[] args) throws IOException, ClassNotFoundException {
        // 1. 创建对象流
        FileInputStream fis = new FileInputStream("D:\\student.bin");
        ObjectInputStream obs = new ObjectInputStream(fis);
        // 2. 读取文件（反序列化）
//        Student s = (Student) obs.readObject();  //readObject() 返回类型为Object，因此需要强转
//        Student o = (Student)obs.readObject();


        ArrayList<Student> objects=(ArrayList<Student>) obs.readObject();

        // 3. 关闭
        obs.close();
        System.out.println("反序列化执行完毕");
//        System.out.println(s.toString());
//        System.out.println(o.toString());

        System.out.println(objects.toString());

    }
}

运行结果

反序列化执行完毕
[Student{name='zhangsan', age=0}, Student{name='lisi', age=0}]

3.编码方式（常见字符形式）

引言
- 在计算机中提供给用户最常见的显示就是字符，也称之为文本，字符的种类非常多，每种语言都有自己的字符集，那么，这么多的字符，如何存储进计算机中呢？
计算机存储字符的本质原理
- 每个字符都通过字符集的映射转化为一个整数存储在计算机中，所以存储字符的本质还是存储整数。
- 将字符转为对应码值，然后将码值转换为二进制，最后存到计算机中。

3.1 常用编码介绍

采用不同的编码方式，则字符对应的码值就不同。目前常见的编码方式有：
- ASCII码。固定使用1个字节来表示字符，可以表示128个字符
- Unicode码。固定使用2个字节来表示字符（字母和汉字都是）。
- utf-8。字母用1个字节表示，汉字用3个字节表示。
- GBK。字母用1个字节表示，汉字用2个字节表示。

3.2 各编码详细介绍

英文字符集 —— ASCII
- 上个世纪60年代，美国制定了一套字符编码，对英语字符与二进制位之间的关系做了统一规定，这一规定被称为 ASCII 码
- ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码
- ASCII 码规定使用一个字节来存储英文字符，最前面的一位统一规定为0，不同的字符由后面的7位确定，所以ASCII码一共规定了128个字符的编码
- 【优点】只用1个字节表示字符
- 【缺点】最多只表示127个字符，表示字符数量有限。
全世界的字符集 —— Unicode
- 全世界的语言非常多，每种语言都有自己的字符集，非常的不方便，并且极其容易出现乱码，所以Unicode字符集的诞生就是为了将世界上所有的字符都纳入其中，形成一种统一的编码规定。
- Unicode，统一码，又叫万国码。
- Unicode只是一个符号集，它只规定了符号的二进制代码，却没有规定这个二进制代码应该如何存储
- 【优点】不会出现乱码现象
- 【缺点】固定使用2个字节表示一个字符（包括字母、汉字），比较占用存储空间。
UTF-8编码
- UTF-8（8位元，Universal Character Set/Unicode Transformation Format）是针对Unicode的一种可变长度字符编码。（可以理解为是对Unicode编码的改进）
- 它可以用来表示Unicode编码中的任何字符，而且其编码中的第一个字节仍与ASCII相容（即同样向下兼容ASCII编码），使得原来处理ASCII字符的软件无须或只进行少部分修改后，便可继续使用。因此，它逐渐成为电子邮件、网页及其他存储或传送文字的应用中，优先采用的编码。
- 【特点】字母用1个字节表示，汉字用3个字节。
中文字符集 —— GBK
- 中华文明源远流长，目前汉字大约有十万个，常用的汉字都有几千个，这么多的字符，显然靠美国的ASCII码字符集是不可能存储的
- 国家标准化委员于1995年颁布了GBK标准，全称“汉字编码扩展规范”，GBK兼容GB2312标准，同时在GB2312标准的基础上扩展了GB13000包含的字，但编码不同
- GBK标准中收录了2万多汉字及符号，因其最早被WINDOWS采用，所以其应用范围非常广

————————————————————————————————————————————————————————————————————————————

IO流详解之字节流与编码方式

IO流

1.流的概念和分类

2.字节流

2.1字节流抽象类

2.2文件字节流

2.21 文件字节输入流代码演示

运行结果

2.22 文件字节输出流代码演示

运行结果

2.23 文件字节流复制文件代码演示

运行结果

2.3 字节缓冲流

2.31 字节缓冲输入流代码演示：

运行结果

2.32 字节缓冲输出流代码演示：

运行结果

2.4 对象流

2.41 序列化代码演示：

运行结果

2.42 反序列化代码演示：

运行结果

3.编码方式（常见字符形式）

3.1 常用编码介绍

3.2 各编码详细介绍

更多参考

公告