Java的序列化与反序列化
目录
- 1.为什么要进行Java序列化
- 2.Java中的序列化如何工作
- 2-1.什么是serialVersionUID常数
- 2-2.什么是瞬时变量?
- 3.有关Java序列化的更多信息
1.为什么要进行Java序列化
序列化过程: 是指把一个Java对象变成二进制内容,实质上就是一个byte[]数组。 因为序列化后可以把byte[]保存到文件中,或者把byte[]通过网络传输到远程(IO),这样,就相当于把Java对象存储到文件或者通过网络传输出去了。
反序列化过程: 把一个二进制内容(也就是byte[]数组)变回Java对象。有了反序列化,保存到文件中的byte[]数组又可以“变回”Java对象,或者从网络上读取byte[]并把它“变回”Java对象。
以下是一些使用序列化的示例:
-以面向对象的方式将数据存储到磁盘上的文件,例如,Redis存储Student对象的列表。
-将程序的状态保存在磁盘上,例如,保存游戏状态。
-通过网络以表单对象形式发送数据,例如,在聊天应用程序中以对象形式发送消息。
一个Java对象要能序列化,必须实现一个特殊的java.io.Serializable接口,它的定义如下:
public interface Serializable { }
Serializable接口没有定义任何方法,它是一个空接口。我们把这样的空接口称为“标记接口”(Marker Interface),实现了标记接口的类仅仅是给自身贴了个“标记”,并没有增加任何方法。
2.Java中的序列化如何工作
当且仅当对象的类实现java.io.Serializable 接口时,该对象才有资格进行序列化。可序列化 是一个标记接口(不包含任何方法),该接口告诉Java虚拟机(JVM)该类的对象已准备好写入持久性存储或通过网络进行读取。
默认情况下,JVM负责编写和读取可序列化对象的过程。序列化/反序列化功能通过对象流类的以下两种方法公开:
- ObjectOutputStream.writeObject(Object):将可序列化的对象写入输出流。如果要序列化的某些对象未实现Serializable接口,则此方法将引发NotSerializableException。
- ObjectInputStream.readObject():从输入流读取,构造并返回一个对象。如果找不到序列化对象的类,则此方法将引发ClassNotFoundException。 如果序列化使用的类有问题,则这两种方法都将引发InvalidClassException,如果发生I / O错误,则将引发IOException。无论NotSerializableException和InvalidClassException是子类IOException异常。
让我们来看一个简单的例子。以下代码将String对象序列化为名为“ data.ser”的文件。字符串对象是可序列化的,因为String类实现了Serializable 接口:
1 String filePath = "data.ser"; 2 String message = "Java Serialization is Cool"; 3 4 try ( 5 FileOutputStream fos = new FileOutputStream(filePath); 6 ObjectOutputStream outputStream = new ObjectOutputStream(fos); 7 ) { 8 9 outputStream.writeObject(message); 10 11 } catch (IOException ex) { 12 System.err.println(ex); 13 }
以下代码反序列化文件“ data.ser”中的String对象:
请注意,readObject()返回一个Object类型的对象,因此您需要将其强制转换为可序列化的类,在这种情况下为String类。
让我们看一个涉及使用自定义类的更复杂的示例。
给定以下学生班:
1 import java.io.*; 2 import java.util.*; 3 4 /** 5 * Student.java 6 * @author zbt 7 */ 8 public class Student extends Person implements Serializable { 9 public static final long serialVersionUID = 1234L; 10 11 private long studentId; 12 private String name; 13 private transient int age; 14 15 public Student(long studentId, String name, int age) { 16 super(); 17 this.studentId = studentId; 18 this.name = name; 19 this.age = age; 20 21 System.out.println("Constructor"); 22 } 23 24 public String toString() { 25 return String.format("%d - %s - %d", studentId, name, age); 26 } 27 }
-long serialVersionUID类型的常量。
-成员变量age被标记为transient。
下面让我解释一下它们。
2-1.什么是serialVersionUID常数
serialVersionUID是一个常数,用于唯一标识可序列化类的版本。从输入流构造对象时,JVM在反序列化过程中检查此常数。如果正在读取的对象的serialVersionUID与类中指定的序列号不同,则JVM抛出InvalidClassException。这是为了确保正在构造的对象与具有相同serialVersionUID的类兼容。 请注意,serialVersionUID是可选的。这意味着如果您不显式声明Java编译器,它将生成一个。 那么,为什么要显式声明serialVersionUID呢? 原因是:自动生成的serialVersionUID是基于类的元素(成员变量,方法,构造函数等)计算的。如果这些元素之一发生更改,serialVersionUID也将更改。想象一下这种情况:
-您编写了一个程序,将Student类的某些对象存储到文件中。Student类没有显式声明的serialVersionUID。
-有时,您更新了Student类(例如,添加了一个新的私有方法),现在自动生成的serialVersionUID也被更改了。
-您的程序无法反序列化先前编写的Student对象,因为那里的serialVersionUID不同。JVM抛出InvalidClassException。
这就是为什么建议为可序列化类显式添加serialVersionUID的原因。
2-2.什么是瞬时变量?
在上面的Student类中,您看到成员变量age被标记为transient,对吗?JVM 在序列化过程中跳过瞬态变量。这意味着在序列化对象时不会存储age变量的值。 因此,如果成员变量不需要序列化,则可以将其标记为瞬态。 以下代码将Student对象序列化为名为“ students.ser”的文件:
1 String filePath = "students.ser"; 2 Student student = new Student(123, "John", 22); 3 4 try ( 5 FileOutputStream fos = new FileOutputStream(filePath); 6 ObjectOutputStream outputStream = new ObjectOutputStream(fos); 7 ) { 8 9 outputStream.writeObject(student); 10 11 } catch (IOException ex) { 12 System.err.println(ex); 13 }
请注意,在序列化对象之前,变量age的值为22。 下面的代码从文件中反序列化Student对象:
此代码将输出以下输出:
1个 123 - John - 0
3.有关Java序列化的更多信息
你应该了解一些有关序列化的重要信息:
- 序列化一个对象时,它所引用的所有其他对象也会被序列化,依此类推,直到序列化完整的对象树为止。
- 如果超类实现Serializable,则其子类会自动执行。
- 反序列化可序列化类的实例时,构造函数将不会运行。
- 如果超类未实现Serializable,则在反序列化子类对象时,超类构造函数将运行。
- 静态变量未序列化,因为它们不是对象本身的一部分。
- 如果序列化集合或数组,则每个元素都必须可序列化。单个不可序列化的元素将导致序列化失败(NotSerializableException)。
- JDK中的可序列化类包括原始包装器(Integer,Long,Double等),String,Date,collection类…对于其他类,请查阅相关的Javadoc来了解它们是否可序列化。