IO流详解之字节流与编码方式

IO流

1.流的概念和分类

  • IO流核心组成
    • 核心组成:一个类(File)、一个接口(Serializable)、四个抽象类(InputStream/OutputStream、Reader/Writer)

思维

  • 什么是流

    • 流:内存与存储设备之间传输数据的通道
  • 流的分类

  • 按方向

    • 输入流:将<存储设备>中的内容读到<内存>中
    • 输出流:将<内存>中的内容写到<存储设备>中
  • 按单位

    • 字节流:以字节为单位,可以读写所有数据
    • 字符流:以字符为单位,只能读写文本数据
  • 按功能

    • 节点流:具有实际传输数据的读写功能
    • 过滤流:在节点流的基础之上增强功能

2.字节流

2.1字节流抽象类

  • InputStream

    • 此抽象类是表示字节输入流的所有类的父类。InputSteam是一个抽象类,它不可以实例化。数据的读取需要由它的子类来实现。根据节点的不同,它派生了不同的节点流子类。
    • 继承自InputSteam的流都是用于向程序中输入数据,且数据的单位为字节(8 bit)
    • 常用方法:

      public int read(){}:读取一个字节的数据,并将字节的值作为int类型返回(0-255之间的一个值)。如果未读出字节则返回-1(返回值为-1表示读取结束)。while((data=fis.read())!=-1)来判断读取文件是否结束。
      public int read(byte[] b){} :从该输入流读取最多 b.length个字节的数据,并把读取的数据存放到b这个字符数组里面
      public int read(byte[] b, int off, int len){}
  • OutputStream

    • 此抽象类是表示字节输出流的所有类的父类。输出流接收输出字节并将这些字节发送到某个目的地
      public void write(int n):向目的地中写入一个字节
      public void write(byte[] b){} : 将 b.length个字节从指定的字节数组写入此文件输出流。
      public void write(byte[] b, int off, int len){}

2.2文件字节流

  • FileInputStream:

    • public int read(byte[] b) // 从流中读取多个字节,将读到内容存入 b 数组,返回实际读到的字节数;如果达到文件的尾部,则返回 -1
  • FileOutputStream:

    • public void write(byte[] b) // 一次写多个字节,将 b 数组中所有字节,写入输出流

2.21 文件字节输入流代码演示

package stream.demo01;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
/*
    FileInputStream 使用
    文件字节输入流

*/

public class FileInputStreamTest {
    public static void main(String[] args) throws IOException {
        // 1 创建FileInputStream 并指定文件路径
        FileInputStream fileInputStream = new FileInputStream("D:\\atext.txt");

        // 2 读取文件
        /*
         // 方式一:单字节读取
        int date=0;
        //int d1 = fileInputStream.read();  不可以在这里赋值给d1,不然就只是读了一个字节
        //必须加括号,不然不知道执行谁
        while ((date=fileInputStream.read())!=-1){
            System.out.print((char) date);
        }
        */
        // 方式二:一次读取多个字节(3)
        byte[] array=new byte[3];// 大小为3的缓存区
        /*
        int count = fileInputStream.read(array);
        //System.out.println((new String(array)));// 一次读3个
        String  s  = new String(array);
        System.out.println(s);

        int count2 = fileInputStream.read(array);
        System.out.println(new String(array));// 再读3个

        int count3=fileInputStream.read(array);
        System.out.println(new String(array));
*/

        // 上述优化后
        int count=0;
        //返回读取到了多少个元素,如果没有读取到返回-1
        while ((count=fileInputStream.read(array))!=-1){
            System.out.println(new String(array,0,count)); // new String(bytes, 0, count) 转换字符串从bytes的0下标开始,读count个字符串

        }
        // 3 关闭
        fileInputStream.close();
        System.out.println();
        System.out.println("执行完毕");

    }
}



运行结果

abc
def
gha
bcd
efg
hab
cde
fga
bcd
efg
hab
cde
fgh
abc
def
ghh
abc
def
gha
bcd
efg
h

执行完毕


2.22 文件字节输出流代码演示

package stream.demo01;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
/*
   文件输出流的使用
    FileOutputStream

*/

public class FileOutputStreamTest {
    public static void main(String[] args) throws IOException {
        // 1 创建文件字节输出流
        FileOutputStream fileOutputStream = new FileOutputStream("D:\\fff.txt",true);// true表示不覆盖 接着写
        /*
        // 2 写入文件
        fileOutputStream.write(97);
        fileOutputStream.write('b');
        fileOutputStream.write('c');
        fileOutputStream.write('d');
        fileOutputStream.write('e');
        */

        byte[] bytes = new byte[10];
        String st="hello world";
        fileOutputStream.write(st.getBytes());//getBytes():获取字节数据
        //getBytes(String charsetName):使用指定的字符集将字符串编码为byte序列,并将结果存储到一个新的byte数组中


        // 3 关闭
        fileOutputStream.close();
        System.out.println("复制完成");
    }
}



运行结果

复制完成

fff


2.23 文件字节流复制文件代码演示

package stream.demo01;

import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;

//使用字节流实现文件的复制
public class StreamCopyTest {
    public static void main(String[] args) throws IOException {
        // 1 创建流
        // 1.1 文件字节输入流
        FileInputStream fis = new FileInputStream("D:\\a50.jpg");
        // 1.2 文件字节输出流
        FileOutputStream fos = new FileOutputStream("D:\\b50.jpg");

        // 2 边读边写
        byte[] bytes = new byte[1024*5];
        int count=0;
        while ((count=fis.read(bytes))!=-1){
            fos.write(bytes,0,count);
        }

        // 3 关闭
        fis.close();
        fos.close();
        System.out.println("执行完毕");
    }
}



运行结果

执行完毕

2.3 字节缓冲流

  • 缓冲流:BufferedInputStream/ BufferedOutputStream
    • 提高IO效率,减少访问磁盘次数
    • 数据存储在缓冲区中,flush是将缓冲区的内容写入文件中,也可以直接close


2.31 字节缓冲输入流代码演示:

package stream.demo01;

import java.io.BufferedInputStream;
import java.io.FileInputStream;
// 字节缓冲流输入流
public class BufferedInputStreamTest {
    public static void main(String[] args) throws Exception {
        // 1 创建BufferedInputStream
        FileInputStream fis = new FileInputStream("D:\\atext.txt");
        BufferedInputStream bis = new BufferedInputStream(fis);// 目的是增强底层流的功能, 先读到缓冲区
                                                    //创建字节缓冲流对象时需要向其输入一个底层流
        /*
        // 2 读取
        int count=0;
        while ((count=bis.read())!=-1){
            System.out.print((char)count);
        }
        */
        // 用自己创建的缓冲流
        byte[] bytes = new byte[1024 * 5];
        int count=0;
        while ((count=bis.read(bytes))!=-1){
            System.out.println(new String(bytes,0,count));
        }
        // 3 关闭
        bis.close();

    }
}


运行结果

abcdefghabcdefghabcdefgabcdefghabcdefghabcdefghhabcdefghabcdefgh

2.32 字节缓冲输出流代码演示:

package stream.demo01;


import java.io.*;

// 使用字节缓冲流 写入 文件
public class BufferedOutputStreamTest {

    public static void main(String[] args) throws IOException {
        // 1 创建BufferedInputStream
        FileOutputStream fis = new FileOutputStream("D:\\buffer.txt");
        BufferedOutputStream bufferedOutputStream = new BufferedOutputStream(fis);
        // 2 写入文件
        for (int i = 0; i < 10; i++) {// 此时读到了缓冲区,没有在文件中
            bufferedOutputStream.write("hello world\r\n".getBytes());//\r\n 转义字符换行打印

        }
        System.out.println("执行完毕");
        // 3 关闭    bos.flush(); // 刷新到硬盘   close方法里自带有
        bufferedOutputStream.close();

    }
}

运行结果

执行完毕

jieg


2.4 对象流

  • ObjectInputStream/ObiectOutputStream

    • 增强了缓冲区功能

    • 增强了读写 8 种基本数据类型和字符串功能

    • 增强了读写对象的功能
      readObject()从流中读取一个对象
      writeObject(Object obj)向流中写入一个对象

    • 使用流传输对象的过程称为序列化、反序列化

  • 序列化对象类的书写注意事项

    • 序列化类必须实现 Serializable 接口
    • 序列化类中的对象属性要实现 Serializable 接口
    • 序列化版本号ID,保证序列化的类和反序列化的类是同一个类private static final long serialVersionUID = 100L;
    • 使用transient修饰属性,这个属性就不能序列化
    • 静态属性不能序列化
    • 序列化多个对象,可以借助集合来实现

2.41 序列化代码演示:

package stream.demo01;

import java.io.Serializable;

public class Student implements Serializable {
    //类要想序列化必须实现Serializable接口
    private String name;
   // private int age;
    private  transient int age;  //Student{name='zhangsan', age=0}
    //使用transient修饰属性,使属性不能被序列化

    public Student() {
    }

    public Student(String name, int age) {
        this.name = name;
        this.age = age;
    }

    public String getName() {
        return name;
    }

    public void setName(String name) {
        this.name = name;
    }

    public int getAge() {
        return age;
    }

    public void setAge(int age) {
        this.age = age;
    }

    @Override
    public String toString() {
        return "Student{" +
                "name='" + name + '\'' +
                ", age=" + age +
                '}';
    }
}


package stream.demo01;

import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.ObjectOutputStream;
import java.util.ArrayList;

// 使用objectoutputStream实现对象的序列化
//注意:在写对象这个类的时候需要public class Student implements Serializable实现这个接口。
/*
1.某个类要想序列化必须实现Serializable接口
2.序列化类中对象属性要求实现Serializable接口
3.序列化版本号ID,保证序列化的类和反序列化的类是同一个类
4.使用transient修饰属性,这个属性就不能序列化
5.静态属性不能序列化
6.序列化多个对象,可以借助集合来实现


*/

public class ObjectOutputStreamTest {
    public static void main(String[] args) throws IOException {
        // 1. 创建对象流
        FileOutputStream fos = new FileOutputStream("D:\\student.bin");//这里文件类型可以随便写,但是和反序列化一定要一致
        ObjectOutputStream obj = new ObjectOutputStream(fos);               //bin表示这是一个二进制文件类型
        // 2. 序列化(写入操作)
        Student s = new Student("zhangsan",18);
        Student lisi = new Student("lisi", 20);

        ArrayList<Student> Arry=new ArrayList<>();
        Arry.add(s);
        Arry.add(lisi);
        obj.writeObject(Arry);

//        obj.writeObject(s);
//        obj.writeObject(lisi);

        // 3. 关闭
        obj.close();
        System.out.println("序列化执行完毕");


    }
}

运行结果

序列化执行完毕



2.42 反序列化代码演示:

package stream.demo01;

import java.io.FileInputStream;
import java.io.IOException;
import java.io.ObjectInputStream;
import java.util.ArrayList;
import java.util.Objects;

// 使用ObjectInputSteam实现反序列化(读取重构对象)
//反序列化(重构成对象)
public class ObjectInputStreamTest {
    public static <ArrrayList> void main(String[] args) throws IOException, ClassNotFoundException {
        // 1. 创建对象流
        FileInputStream fis = new FileInputStream("D:\\student.bin");
        ObjectInputStream obs = new ObjectInputStream(fis);
        // 2. 读取文件(反序列化)
//        Student s = (Student) obs.readObject();  //readObject() 返回类型为Object,因此需要强转
//        Student o = (Student)obs.readObject();


        ArrayList<Student> objects=(ArrayList<Student>) obs.readObject();

        // 3. 关闭
        obs.close();
        System.out.println("反序列化执行完毕");
//        System.out.println(s.toString());
//        System.out.println(o.toString());

        System.out.println(objects.toString());

    }
}

运行结果

反序列化执行完毕
[Student{name='zhangsan', age=0}, Student{name='lisi', age=0}]


3.编码方式(常见字符形式)

  • 引言

    • 在计算机中提供给用户最常见的显示就是字符,也称之为文本,字符的种类非常多,每种语言都有自己的字符集,那么,这么多的字符,如何存储进计算机中呢?
  • 计算机存储字符的本质原理

    • 每个字符都通过字符集的映射转化为一个整数存储在计算机中,所以存储字符的本质还是存储整数。
    • 将字符转为对应码值,然后将码值转换为二进制,最后存到计算机中。

3.1 常用编码介绍

  • 采用不同的编码方式,则字符对应的码值就不同。目前常见的编码方式有:
    • ASCII码。固定使用1个字节来表示字符,可以表示128个字符
    • Unicode码。固定使用2个字节来表示字符(字母和汉字都是)。
    • utf-8。字母用1个字节表示,汉字用3个字节表示。
    • GBK。字母用1个字节表示,汉字用2个字节表示。

3.2 各编码详细介绍

  • 英文字符集 —— ASCII

    • 上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的关系做了统一规定,这一规定被称为 ASCII 码

    • ASCII ((American Standard Code for Information Interchange): 美国信息交换标准代码

    • ASCII 码规定使用一个字节来存储英文字符,最前面的一位统一规定为0,不同的字符由后面的7位确定, 所以ASCII码一共规定了128个字符的编码

    • 【优点】只用1个字节表示字符

    • 【缺点】最多只表示127个字符,表示字符数量有限。

  • 全世界的字符集 —— Unicode

    • 全世界的语言非常多,每种语言都有自己的字符集,非常的不方便,并且极其容易出现乱码,所以Unicode字符集的诞生就是为了将世界上所有的字符都纳入其中,形成一种统一的编码规定。

    • Unicode,统一码,又叫万国码。

    • Unicode只是一个符号集,它只规定了符号的二进制代码,却没有规定这个二进制代码应该如何存储

    • 【优点】不会出现乱码现象

    • 【缺点】固定使用2个字节表示一个字符(包括字母、汉字),比较占用存储空间。

  • UTF-8编码

    • UTF-8(8位元,Universal Character Set/Unicode Transformation Format)是针对Unicode的一种可变长度字符编码。(可以理解为是对Unicode编码的改进)

    • 它可以用来表示Unicode编码中的任何字符,而且其编码中的第一个字节仍与ASCII相容(即同样向下兼容ASCII编码),使得原来处理ASCII字符的软件无须或只进行少部分修改后,便可继续使用。因此,它逐渐成为电子邮件、网页及其他存储或传送文字的应用中,优先采用的编码。

    • 【特点】字母用1个字节表示,汉字用3个字节。

  • 中文字符集 —— GBK

    • 中华文明源远流长,目前汉字大约有十万个,常用的汉字都有几千个,这么多的字符,显然靠美国的ASCII码字符集是不可能存储的
    • 国家标准化委员于1995年颁布了GBK标准,全称“汉字编码扩展规范”,GBK兼容GB2312标准,同时在GB2312标准的基础上扩展了GB13000包含的字,但编码不同
    • GBK标准中收录了2万多汉字及符号,因其最早被WINDOWS采用,所以其应用范围非常广

————————————————————————————————————————————————————————————————————————————

更多参考

千峰教育-IO框架

字符在计算机中的存储
Java计算机如何存储字符&&常用编码介绍

posted @ 2022-07-05 20:47  哼哼哈¥  阅读(146)  评论(0编辑  收藏  举报