java序列化和反序列化
java领域的对象如何传输
基于socket进行对象传输
如果传输的对象没有序列化会报错:
那么如何解决这个问题呢?
实现一个Serializable接口,再次运行就可以看到对象可以正常传输了
public class User implements Serializeable{
}
序列化的意义
当我们对User这个类增加一个Serializable,就可以解决java对象的网络传输问题。这就是序列化的意义。
java平台允许我们在内存中创建可复用的java对象,但一般情况下,只有当JVM处于运行时,这些对象才可能存在,即这些对象的生命周期不会比JVM的生命周
期更长。但在现实应用中,就可能要求在JVM停止运行之后能够保存(持久化)指定的对象,并在将来重新读取被保存的对象。java对象序列化就能够帮助我们实
现该功能。
简单来说
序列化是把对象的状态信息转化为可存储或传输的形式过程,也就是把对象转化为字节序列的过程称为对象的序列化。
反序列化是序列化的逆向过程,把字节数组反序列化为对象,把字节序列恢复为对象的过程成为对象的反序列化。
序列化的进阶
java原生序列化
主要通过输出流java.io.ObjectOutputStream和对象输入流java.io.ObjectInputStream来实现。
java.io.ObjectOutputStream:表示对象输出流,它的writeObject(Object obj)方法可以对参数指定的obj对象进行序列化,把得到的字节序列写到一个目标输出
流中。
java.io.ObjectInputStream:表示对象输入流,它的readObject()方法源输入流中读取字节序列,在把他们反序列化成为一个对象,并将其返回。
需要注意的是,被序列化对象需要实现java.io.Serializeable接口
serialVersionUID的作用
设置serialVersionUID,字面的意思是序列化的版本号,凡是实现Serializable接口的类都有一个表示序列化版本标识符的静态变量。
证明操作:
1.先将user对象序列化到文件中
2.然后修改user对象,增加serialVersionUID字段
3.然后通过反序列化来把对象提取出来
4.结果:无法反序列化
结论
java的序列化机制是通过判断类的serialVersion来验证版本一致性的。在进行反序列化时,JVM会把传来的字节流中的serialVersionUID于本地相应实体类的
serialVersionUID进行比较,如果相同就认为是一致的,可以进行反序列化,否则就会出现序列化不一致的异常,即是InvalidCastExecption。
从结果可以看出,文件流中的class和classpath中的class,也就是修改过后的class,不兼容了,处于安全机制考虑,程序抛出了错误,并且拒绝载入。从错误结
果来看,如果没有为指定的class配置serialVersionUID,那么java编译器会自动给这个class进行一个摘要算法,类似于指纹算法,只要这个文件有任何改动,得到
的UID就会截然不同的,可以保证在这么类中,这个编号是唯一的。所以,由于没有现实指定serialVersionUID,编译器有为我们生成了一个UID,当然和前面保存在
文件中的那个不会一样,于是就出现了2个序列号不一致的错位,因此,只要我们自己指定可serialVersionUID,就可以在序列化后,去添加一个字段,或者方法,
而不会影响到后期的还原,还原后的对象照样可以使用,而且还多个方法或者属性可以用。
tips:serialVersionUID有两种显示的生成方式:
一是默认的1L,比如:private static final long serialVersionUID = 1L;
二是根据类名、接口名、成员方法及属性等来生成一个64位的哈希字段
当实现java.io.Serializable接口的类没有显式的定义一个serialVersionUID变量时候,java序列化机制会根据编译的Class自动生成一个serialVersionUID作序列化版本比较,这种情况下,
如果Class文件(类名,方法名等)没有发生变化(增加空格,换行,增加注释等等),就算再编译多次,serialVersionUID也不会变化的。
Transient关键字
Transient关键字的作用是控制变量的序列化,在变量声明前加上该关键字,可以阻止该变量被序列化到文件中,在被反序列化后,transient变量的值被设为初始
值,如int型的是0,对象型的是null。
绕开transient机制的方法
private transient String name;
如上虽然name被transient修饰,但是通过我们写的两个方法依然能够使得name字段正确被序列化和反序列化
writeObject和readObject原理
writeObject和readObject是两个私有的方法,他们是什么时候被调用呢?从运行结果来看,他确实被调用了。而且他们并不存在于java.lang.Object,也没有在Serializable中去声明。
从源码层面上来分析可以看到,readObject是通过反射来调用的。
其实我们可以在很多的地方看到readObject和writeObject的使用,比如HashMap。
为什么有的代码属性使用了transient修饰符 还要使用writeObject和readObject? 或者说为什么要自己实现writeObject和readObject方法,而不是使用JDK统一的默认序列化和反序列化操作呢?
这里以HashMap为例:首先要明确序列化的目的,将java对象序列化,一定是为了在某个时刻能够将该对象反序列化,而且一般来讲序列化和反序列化所在的机器是不同的,
因为序列化最常用的场景就是跨机器的调用,而序列化和反序列化的一个最基本的要求就是,反序列化之后的对象与序列化之前的对象是一致的。
HashMap中,由于Entry的存放位置是根据Key的Hash值来计算,然后存放到数组中的,对于同一个Key,在不同的JVM实现中计算得出的Hash值可能是不同的。
Hash值不同导致的结果就是:有可能一个HashMap对象的反序列化结果与序列化之前的结果不一致。即有可能序列化之前,Key=’AAA’的元素放在数组的第0个位置,而反序列
化值后,根据Key获取元素的时候,可能需要从数组为2的位置来获取,而此时获取到的数据与序列化之前肯定是不同的。
解决方式:
将可能会造成数据不一致的元素使用transient关键字修饰,从而避免JDK中默认序列化方法对该对象的序列化操作。不序列化的包括:Entry[] table,size,modCount。
自己实现writeObject方法,从而保证序列化和反序列化结果的一致性。
QA:那么,HashMap又是通过什么手段来保证序列化和反序列化数据的一致性的呢?
首先,HashMap序列化的时候不会将保存数据的数组序列化,而是将元素个数以及每个元素的Key和Value都进行序列化。
在反序列化的时候,重新计算Key和Value的位置,重新填充一个数组。
QA:想想看,是不是能够解决序列化和反序列化不一致的情况呢?
由于不序列化存放元素的Entry数组,而是反序列化的时候重新生成,这样就避免了反序列化之后根据Key获取到的元素与序列化之前获取到的元素不同。
java序列化的一些简单总结
-
java序列化只是针对对象的状态进行保存,至于对象中的方法,序列化不关心
-
当一个父类实现了序列化,那么子类会自动实现序列化,不需要显示实现序列化接口
-
当一个对象的实例变量引用了其他对象,序列化这个对象的时候会自动把引用的对象也进行序列化(实现深度克隆)
-
当某个字段被申明为transient后,默认的序列化机制会忽略这个字段
-
被申明为transient的字段,如果需要序列化,可以添加两个私有方法:writeObject和readObject