JVM 类加载子系统
类加载器子系统的作用
- 类加载子系统负责从文件系统或者网络中加载 class 文件,class 文件在开头有特定的文件标识;
- 类加载器只负责 class 文件的加载,至于它是否可以运行,则由执行引擎决定;
- 加载的类信息存放在方法区中,除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是 class 文件常量池部分的内存映射)。
类加载子系统概述图
类加载子系统各个环节
1、loading(加载)
1)通过一个类的全限定名(包名+类型,如:java.lang.String)获取定义此类的二进制字节流;
2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构;
3)在内存中生成一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的访问入口。
2、linking(链接)
1)Verify(验证)
目的在于确保 class 文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。主要包括四种验证:文件格式验证、元数据验证、字节码验证、符号引用验证。
- 文件格式检验
检验字节流是否符合 class 文件格式的规范,并且能被当前版本的虚拟机处理。检验可能包含以下几种:是否以魔数开头(0xCAFEBABE)、主次版本号是否在虚拟机的处理范围之内,常量池中的常量是否有不被支持的类型(检验常量 tag 标志)、class文件中各个部分以及文件本身是否被删除或附加什么信息等等。 只有通过文件格式检验的二进制字节流才能进入内存的方法区进行存储,所以后面的3个检验阶段都是基于方法区的存储结构进行的,不会再操作字节流。
- 元数据检验
对字节码描述的信息进行语义分析,以保证其描述的内容符合 Java 语言规范的要求。 验证点包括:是否有父类(除了object)、父类是否继承了不可被继承的类(被 final 修饰的类)、非抽象类是否实现了其父类或接口之中要求实现的所有方法、类中的方法和字段是否与父类产生矛盾(覆盖了父类的 final 字段、出现不合规矩的方法重载等)。 元数据检验主要是对类的元数据信息进行语义校验,保证不符合 Java 语言规范的元数据信息不存在。
- 字节码检验
通过数据流和控制流分析,确定程序语义是合法、符合逻辑的。第二阶段是对元数据信息中的数据类型做了检验,这一阶段是对类的方法体进行校验分析,保证被校验类的方法在运行时不会做出危害虚拟机安全的事情。检验点包括:保证任意时刻操作数栈的数据类型与指令代码序列都能配合工作、保证指令跳转不会跳转到方法体之外的地方、保证方法体内的类型转换都是有效的。 事实上,即便是经过字节码检验后的方法体也不一定是安全的。
- 符号引用检验
最后一个检验发生在虚拟机将符号引用转化为直接引用时,这个转化动作将在连接的第三阶段(解析阶段)中发生的。符号引用检验可以看作是对类自身以外(常量池中的各种符号引用)的信息进行匹配性校验。 校验点:符号引用中通过字符串描述的全限定名是否能找到对应的类、在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段、符号引用中的类、字段、方法的访问权限是否能让当前类访问到等。 符号引用检验的目的是确保解析动作的正常执行,如果无法通过符号引用检验,将会抛出 java.lang.IncompatibleClassChangeError 异常的子类,如 IllegalAccessError、NoSuchfiledError、NoSuchMethodError 等。
2)Prepare(准备)
- 为变量分配内存且设置该变量的默认初始值,即零值;
- 这里不包含用 final 修饰的 static,因为 final 在编译的时候就会分配,准备阶段显式初始化;
- 这里不会为实例变量分配初始化,类变量分配在方法区中,而实例变量会随着对象一起分配到堆中。
3)Resolve(解析)
- 将常量池内的符号引用转换为直接引用的过程;
- 事实上,解析操作往往会伴随着 JVM 在执行完成初始化之后再执行;
- 符号引用就是一组符号来描述所引用的目的,符号引用的字面量形式明确定义在《java 虚拟机规范》的 class 文件格式中,直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标句柄;
- 解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等,对应常量池中的 CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info 等。
Initialization(初始化)
- 初始化阶段就是执行类构造器方法 <clinit>() 的过程;
- 此方法不需定义,是 javac 编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来;
- 构造器方法中指令按语句在源文件中出现的顺序执行;
- <clinit>() 不同于类的构造器(构造器是虚拟机视角下的<init>(),即类的构造器函数);
- 若该类具有父类,JVM 会保证子类的<clinit>() 执行前,父类的 <clinit>() 已经执行完毕;
- 虚拟机必须保证一个类的 <clinit>() 方法在多线程下被同步加锁。
编写以下代码(ClassTest.java),存在类变量的赋值动作和静态代码块
package test; public class ClassTest { private static int num = 1; static{ num = 2; number = 10; //System.out.println(ClassTest.number); 执行会报错,非法的前向引用 } private static int number = 20; // linking的Prepare阶段时加载到内存中,并设置初始值0;Initialization阶段先赋值为10,再覆盖为20 public static void main(String[] args){ System.out.println(ClassTest.num); System.out.println(ClassTest.number); } }
对 ClassTest.java 文件进行编译,会生成 ClassTest.class 文件。使用 jclasslib 插件查看 ClassTest.class 文件,可以看到 Methods 目录下有个 <clinit> 文件
编写以下代码(InitTest.java),不存在类变量的赋值动作和静态代码块
package test; public class InitTest { private int a = 1; public static void main(String[] args){ int b = 2; } }
对 InitTest.java 文件进行编译,查看字节码文件,可以看到有 <init> 文件,但没有 <clinit> 文件
由此可以看出:类中不存在类变量的赋值动作和静态代码块,编译时,不会生成 <clinit> 文件;任何一个类声明后,内部至少存在一个类的构造器,对应的就是 <init> 文件。