Java虚拟机类加载机制
一、概述
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。
二、类加载的时机
类的生命周期:
类“初始化”的触发条件(有且仅有以下五点):
-
1.遇到new、getstatic、putstatic或invokestatic这4条字节码指令时,如果类没有进行过初始化,则需要触发其初始化;
生成这4条指令的最常见的Java代码场景是:
- 使用new关键字实例化对象时;
- 读取或设置一个类的静态字段(被final修饰,已在编译期把结果放入常量池的静态字段除外)时;
- 调用一个类的静态方法时; -
2.对类进行反射调用时;
-
3.当初始化类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化;
-
4.当虚拟机启动时,会初始化用户指定的要执行的主类(包含main方法的那个类);
-
5.使用jdk1.7的动态语言时,如果一个MethodHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有进行过初始化时;
初次之外,所有引用类的方式都不会触发初始化,称为被动引用。
注意,接口在初始化时,并不要求其父接口全部初始化完成,只有在真正调用到父接口时才会初始化(和上面类的初始化触发条件的第三点不同)。
三、类加载的过程
这里说的类加载包括:加载、验证、准备、解析和初始化。
1.加载
加载阶段,需要完成的事情:
- 1)通过一个类的全限定名来获取定义此类的二进制字节流;
- 2)讲这个字节流所代表的静态存储结构转化为方法区的运行时数据结构;
- 3)在内存中生成一个代表这个类的Class对象,作为方法区这个类的各种数据的访问入口;
关于上面获取二进制字节流,开发人员可以通过自定义自己的类记载器去控制字节流的获取方式(即重写一个类加载器的loadClass方法)。 可以从以下地方获取:
- 从压缩包中获取。常见的有Jar、Ear、War等格式的包;
- 从网络上获取。最典型的应用是Applet;
- 运行时计算生成。用的最多的场景是动态代理技术;
- 由其它文件生成。典型场景是JSP应用;
- 从数据库中获取;
数组类的加载情况(什么是数组类?):
数组类本身不通过类加载器创建,它由Java虚拟机直接创建的。数组类创建过程遵循以下规则:
- 如果数组的组件类型是引用类型,就递归采用上述的加载过程去加载这个组件类型;
- 如果数组的组件类型不是引用类型(如int[]数组),Java虚拟机会把数组标记为与引用类加载器关联;
- 数组类的可见性与它的组件类型的可见性一致。如果组件类型不是引用类型,那数组类的可见性将默认为public;
Class对象虽然是对象,但是它比较特殊,存放在方法区中,这个对象将作为程序访问方法区中的这些类型数据的外部接口。
加载阶段和连接阶段的部分内容是交叉进行的。即加载阶段尚未完成,连接阶段可能已经开始了。
2.验证
验证的目的:
确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
验证的4个阶段:
-
文件格式验证
验证点:- 是否以魔数0xCAFFBABE开头;
- 主、次版本号是否在当前虚拟机处理范围之内;
- 常量池的常量是否有不被支持的常量类型;
- 指向常量的各种类型是否有指向不存在的常量或不符合类型的常量
- ...
-
元数据验证
验证点:- 这个类是否有父类(除了Object类以外,所有的类应当有父类);
- 是否继承了不允许被继承的类(被final修饰的类);
- 如果不是抽象类,是否实现了其父类或者接口中需要实现的方法;
- 类中的字段、方法是否与父类产生矛盾(例如覆盖了父类final字段,或者不符合规则的方法重载等)
这一阶段主要目的是对类的元数据信息进行语义检验,保证不存在付符合Java语言规范的元数据信息。
-
字节码验证
这一阶段的目的是通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。保证被检验类的方法在运行时不会做出危害虚拟机安全的事件。(最复杂的阶段) -
符号引用验证
这一阶段发生在虚拟机将符号引用转化为直接引用对的时候。
可以看做是对类自身以外的信息进行匹配性校验:- 符号引用通过字符串描述的全限定名是否能找到对应的类;
- 在指定类中是否存在符合方法的字段秒数据以及简单名称所描述的方法和字段;
- 符号引用中的类、字段、方法的访问性(private、protected、public、default)是否可被当前类访问;
- ...
3.准备
准备阶段是正式为类变量分配内存病设置变量初始值的阶段,这些变量所使用的内存都将在方法区中进行分配。
注意:
- 这里进行的内存分配仅包括类变量(static修饰的变量),而不包括实例变量,实例变量将在对象实例化时随着对象一起分配在堆中。
- 这里说的初始值是数据类型的“零值”。
4.解析
解析阶段是虚拟机将常量池内的引用符号替换为直接引用的过程。
符号引用和直接引用的关联:
- 符号引用: 以一组符号来描述所引用的目标。
- 直接引用: 直接引用可以是直接指向目标的指针、相对的偏移量或是一个能间接定位到目标的句柄。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符 7类符号引用进行的。
5.初始化
到了初始化阶段,才是真正开始执行类中定义的Java程序代码。
四、类加载器
1.类与类加载器
“通过一个类的全限定名来获取描述此类的二进制字节流”这个动作放到Java虚拟机外部实现,以便让应用程序自己决定如何获取所需要的类。实现这个动作的代码模块称为“类加载器”。
对于任何一个类,都需要由加载它的类加载器和这个类本身一同确定其在Java虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名称空间。(比较两个类是否“相等”,只有在这两个类是由同一个类记载器的前提下才有意义,即使这两个类来源于同一个Class文件。)
2.双亲委派模型
类加载器种类:
- 启动类加载器(Bootstrap ClassLoader)。这个类加载器负责将存放在JAVA_HOME/lib目录中,或者被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的类库加载到虚拟机内存中。
- 扩展类加载器(Extension ClassLoader)。负责加载JAVA_HOME/lib/ext目录中,或者被java.ext.dirs系统变量所指定的路径中的所有类库,开发者可以直接使用扩展类加载器。
- 应用程序加载器(Application ClassLoader)。负责加载用户类路径(ClassPath)上所指定的类库,开发者可以直接使用这个类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下就是程序中的默认的类加载器。
- 自定义加载器(User ClassLoader)。
这些类加载器之间的关系如下:
上图展示的类加载器之间的层次关系,称为类加载器的双亲委派模型(Parents Delegation Model)。
双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应当有自己的父类加载器。
双亲委派模型的工作过程:
如果一个类加载器收到了类加载请求,它首先不会自己去尝试加载这个类,而是把这个请求委派给父加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器中,只有当父类加载器反馈自己无法完成这个加载请求(它的搜索范围内没有找到所需的类)时,子加载器才会尝试自己去加载。
使用双亲委派模型好处:
Java类随着它的类加载器一起具备了一种优先级层次关系。例如,java.lang.Object,它存放在rt.jar中,无论哪一个类加载要加载这个类,最终都是委派给启动类加载器进行加载,因此Object类在程序的各个类加载器环境中都是同一个类。
相反,如果没有使用双亲委派模型,用户自己编写了一个java.lang.Object类,并放在ClassPath中,那么系统中将会出现多个不同的Object类,Java类型体系中最基础的行为也就无法保证,应用程序变得一片混乱。
双亲委派模型的实现:
先检查请求加载的类型是否已经被加载过,若没有则调用父加载器的loadClass()方法,若父加载器为空则默认使用启动类加载器作为父加载器。假如父类加载器加载失败,抛出ClassNotFoundException异常的话,才调用自己的findClass()方法尝试进行加载。
3.破坏双亲委派模型
双亲委派模型并不是一个具有强制性约束的模型,而是Java设计者推荐给开发者们的类加载器实现方式。在Java的世界中大部分的类加载器都遵循这个模型,但也有例外的情况,直到Java模块化出现为止,双亲委派模型主要出现过3次较大规模“被破坏”的情况。
refrence: