𝓝𝓮𝓶𝓸&博客

【JVM之内存与垃圾回收篇】类加载子系统

类加载子系统

概述

完整图如下:

如果自己想手写一个 Java 虚拟机的话,主要考虑哪些结构呢?

  • 类加载器
  • 执行引擎

类加载器子系统作用

类加载器子系统负责从文件系统或者网络中加载 Class 文件,Class 文件在文件开头有特定的文件标识(CAFE BABE)。

ClassLoader 只负责 Class 文件的加载,至于它是否可以运行,则由 Execution Engine 决定。

加载的类信息存放于一块称为方法区的内存空间。除了类的信息外,方法区中还会存放运行时常量池信息,可能还包括字符串字面量和数字常量(这部分常量信息是 Class 文件中常量池部分的内存映射)

  • class file 存在于本地硬盘上,可以理解为设计师画在纸上的模板,而最终这个模板在执行的时候是要加载到 JVM 当中来根据这个文件实例化出 n 个一模一样的实例。
  • class file 加载到 JVM 中,被称为 DNA 元数据模板,放在方法区。
  • 在 .class 文件 -> JVM -> 最终成为元数据模板,此过程就要一个运输工具(类装载器 Class Loader),扮演一个快递员的角色。

类的加载过程

例如下面的一段简单的代码

/**
 * 类加载子系统
 * @author: Nemo
 */
public class HelloLoader {
    public static void main(String[] args) {
        System.out.println("我已经被加载啦");
    }
}

它的加载过程是怎么样的呢?

完整的流程图如下所示

加载阶段

  1. 通过一个类的全限定名获取定义此类的二进制字节流

  2. 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构

  3. 在内存中生成一个代表这个类的 java.lang.Class 对象,作为方法区这个类的各种数据的访问入口

加载.class文件的方式

  • 从本地系统中直接加载
  • 通过网络获取,典型场景:Web Applet
  • 从 zip 压缩包中读取,成为日后 jar、war 格式的基础
  • 运行时计算生成,使用最多的是:动态代理技术
  • 由其他文件生成,典型场景:JSP 应用从专有数据库中提取 .class 文件,比较少见
  • 从加密文件中获取,典型的防止 Class 文件被反编译的保护措施

链接阶段

验证(Verify)

  • 目的在于确保 Class 文件的字节流中包含信息符合当前虚拟机要求,保证被加载类的正确性,不会危害虚拟机自身安全。

  • 主要包括四种验证,文件格式验证,元数据验证,字节码验证,符号引用验证。


工具:Binary Viewer 查看

如果出现不合法的字节码文件,那么将会验证不通过

同时我们可以通过安装 IDEA 的插件,来查看我们的 Class 文件

安装完成后,我们编译完一个 class 文件后,点击 view 即可显示我们安装的插件来查看字节码方法了

准备(Prepare)

  • 为类变量分配内存并且设置该类变量的默认初始值,即零值。

  • 这里不包含用 final 修饰的 static,因为 final 在编译的时候就会分配了,准备阶段会显式初始化;

final 即最后的赋值,即 常量,只能初始化赋值,后面不能修改。

  • 这里不会为实例变量分配初始化,类变量会分配在方法区中,而实例变量是会随着对象一起分配到 Java 堆中。

例如下面这段代码

/**
 * @author: Nemo
 */
public class HelloApp {
    private static int a = 1;  // 准备阶段为0,在下个阶段,也就是初始化的时候才是1
    public static void main(String[] args) {
        System.out.println(a);
    }
}

上面的变量 a 在准备阶段会赋初始值,但不是 1,而是 0。

解析(Resolve)

  • 将常量池内的符号引用转换为直接引用的过程。

  • 事实上,解析操作往往会伴随着 JVM 在执行完初始化之后再执行。

  • 符号引用就是一组符号来描述所引用的目标。符号引用的字面量形式明确定义在《Java 虚拟机规范》的 Class 文件格式中。直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。

  • 解析动作主要针对类或接口、字段、类方法、接口方法、方法类型等。对应常量池中的 CONSTANT Class info、CONSTANT Fieldref info、CONSTANT Methodref info等

初始化阶段

初始化阶段就是执行类构造器法 <clinit>() 的过程。

此方法不需定义,是 javac 编译器自动收集类中的所有类变量的赋值动作和静态代码块中的语句合并而来。

也就是说,当我们代码中包含 static 变量的时候,就会有 <clinit>() 方法

构造器方法中指令按语句在源文件中出现的顺序执行。

<clinit>() 不同于类的构造器。(关联:构造器是虚拟机视角下的 <init>())若该类具有父类,JVM 会保证子类的 <clinit>() 执行前,父类的 <clinit>() 已经执行完毕。

任何一个类在声明后,都有生成一个构造器,默认是空参构造器

/**
 * @author: Nemo
 */
public class ClassInitTest {
    private static int num = 1;
    static {
        num = 2;
        number = 20;
        System.out.println(num);
        System.out.println(number);  //报错,非法的前向引用
    }

    private static int number = 10;

    public static void main(String[] args) {
        System.out.println(ClassInitTest.num); // 2
        System.out.println(ClassInitTest.number); // 10
    }
}

关于涉及到父类时候的变量赋值过程

/**
 * @author: Nemo
 */
public class ClinitTest1 {
    static class Father {
        public static int A = 1;
        static {
            A = 2;
        }
    }

    static class Son extends Father {
        public static int b = A;
    }

    public static void main(String[] args) {
        System.out.println(Son.b);
    }
}

我们输出结果为 2,也就是说首先加载 ClinitTest1 的时候,会找到 main 方法,然后执行 Son 的初始化,但是 Son 继承了 Father,因此还需要执行 Father 的初始化,同时将 A 赋值为 2。我们通过反编译得到 Father 的加载过程,首先我们看到原来的值被赋值成 1,然后又被复制成 2,最后返回

iconst_1
putstatic #2 <com/nemo/java/chapter02/ClinitTest1$Father.A>
iconst_2
putstatic #2 <com/nemo/java/chapter02/ClinitTest1$Father.A>
return

虚拟机必须保证一个类的 <clinit>() 方法在多线程下被同步加锁。

/**
 * @author: Nemo
 */
public class DeadThreadTest {
    public static void main(String[] args) {
        new Thread(() -> {
            System.out.println(Thread.currentThread().getName() + "\t 线程t1开始");
            new DeadThread();
        }, "t1").start();

        new Thread(() -> {
            System.out.println(Thread.currentThread().getName() + "\t 线程t2开始");
            new DeadThread();
        }, "t2").start();
    }
}
class DeadThread {
    static {
        if (true) {
            System.out.println(Thread.currentThread().getName() + "\t 初始化当前类");
            while(true) {

            }
        }
    }
}

上面的代码,输出结果为

线程t1开始
线程t2开始
线程t2 初始化当前类

从上面可以看出初始化后,只能够执行一次初始化,这也就是同步加锁的过程。

类自己是没办法初始化自己的,所以需要类加载器来在类加载中执行类构造器方法,来初始化类。
类可以初始化对象,这样一层管一层

虚拟机保证一个类的<clinit>()方法在多线程下被同步加锁
因为类的 static 修饰的代码都是被 <clinit>() 来执行的,但是虚拟机已经保证在多线程下会对 <clinit>() 的执行加锁,从而保证线程安全,也从而导致了静态内部类实现单例的线程安全,所以说在 singleton 中,实现线程安全就有一个使用内部类的方式,这里就是原因了。

类加载器的分类

JVM 支持两种类型的类加载器 。分别为引导类加载器(Bootstrap ClassLoader)和自定义类加载器(User-Defined ClassLoader)。

从概念上来讲,自定义类加载器一般指的是程序中由开发人员自定义的一类类加载器,但是 Java 虚拟机规范却没有这么定义,而是将所有派生于抽象类 ClassLoader 的类加载器都划分为自定义类加载器。

无论类加载器的类型如何划分,在程序中我们最常见的类加载器始终只有 3 个,如下所示:

这里的四者之间是包含关系,不是上层和下层,也不是子系统的继承关系。

我们通过一个类,获取它不同的加载器

/**
 * @author: Nemo
 */
public class ClassLoaderTest {
    public static void main(String[] args) {
        // 获取系统类加载器
        ClassLoader systemClassLoader = ClassLoader.getSystemClassLoader();
        System.out.println(systemClassLoader);

        // 获取其上层的:扩展类加载器
        ClassLoader extClassLoader = systemClassLoader.getParent();
        System.out.println(extClassLoader);

        // 试图获取 根加载器
        ClassLoader bootstrapClassLoader = extClassLoader.getParent();
        System.out.println(bootstrapClassLoader);

        // 获取自定义加载器
        ClassLoader classLoader = ClassLoaderTest.class.getClassLoader();
        System.out.println(classLoader);
        
        // 获取String类型的加载器
        ClassLoader classLoader1 = String.class.getClassLoader();
        System.out.println(classLoader1);
    }
}

得到的结果,从结果可以看出 根加载器无法直接通过代码获取,同时目前用户代码所使用的加载器为系统类加载器。同时我们通过获取 String 类型的加载器,发现是 null,那么说明 String 类型是通过根加载器进行加载的,也就是说 Java 的核心类库都是使用根加载器进行加载的。

sun.misc.Launcher$AppClassLoader@18b4aac2
sun.misc.Launcher$ExtClassLoader@1540e19d
null
sun.misc.Launcher$AppClassLoader@18b4aac2
null 

虚拟机自带的加载器

启动类加载器(引导类加载器,Bootstrap ClassLoader)

  • 这个类加载使用 C/C++ 语言实现的,嵌套在 JVM 内部。
  • 它用来加载 Java 的核心库(JAVAHOME/jre/lib/rt.jar(runtime)、resources.jar 或 sun.boot.class.path 路径下的内容),用于提供JVM自身需要的类
  • 并不继承自 java.lang.ClassLoader,没有父加载器。
  • 加载扩展类和应用程序类加载器,并指定为他们的父类加载器。
  • 出于安全考虑,Bootstrap 启动类加载器只加载包名为 java、javax、sun等开头的类

扩展类加载器(Extension ClassLoader)

  • Java 语言编写,由 sun.misc.Launcher$ExtClassLoader 实现。
  • 派生于 ClassLoader 类
  • 父类加载器为启动类加载器
  • 从 java.ext.dirs 系统属性所指定的目录中加载类库,或从 JDK 的安装目录的 jre/lib/ext 子目录(扩展目录)下加载类库。如果用户创建的 JAR 放在此目录下,也会自动由扩展类加载器加载。

应用程序类加载器(系统类加载器,AppClassLoader)

  • java 语言编写,由 sun.misc.LaunchersAppClassLoader 实现
  • 派生于 ClassLoader 类
  • 父类加载器为扩展类加载器
  • 它负责加载环境变量 classpath 或系统属性 java.class.path 指定路径下的类库
  • 该类加载是程序中默认的类加载器,一般来说,Java 应用的类都是由它来完成加载
  • 通过 classLoader#getSystemclassLoader() 方法可以获取到该类加载器

用户自定义类加载器

在 Java 的日常应用程序开发中,类的加载几乎是由上述 3 种类加载器相互配合执行的,在必要时,我们还可以自定义类加载器,来定制类的加载方式。

为什么要自定义类加载器?

  • 隔离加载类
  • 修改类加载的方式
  • 扩展加载源
  • 防止源码泄漏

用户自定义类加载器实现步骤:

  1. 开发人员可以通过继承抽象类 java.lang.ClassLoader 类的方式,实现自己的类加载器,以满足一些特殊的需求
  2. 在 JDK1.2 之前,在自定义类加载器时,总会去继承 ClassLoader 类并重写 loadClass() 方法,从而实现自定义的类加载类,但是在 JDK1.2 之后已不再建议用户去覆盖 loadclass() 方法,而是建议把自定义的类加载逻辑写在 findclass() 方法中
  3. 在编写自定义类加载器时,如果没有太过于复杂的需求,可以直接继承 URIClassLoader 类,这样就可以避免自己去编写 findclass() 方法及其获取字节码流的方式,使自定义类加载器编写更加简洁。

查看根加载器所能加载的目录

刚刚我们通过概念了解到了,根加载器只能够加载 java /lib 目录下的 class,我们通过下面代码验证一下

/**
 * @author: Nemo
 */
public class ClassLoaderTest1 {
    public static void main(String[] args) {
        System.out.println("*********启动类加载器************");
        // 获取BootstrapClassLoader 能够加载的API的路径
        URL[] urls = sun.misc.Launcher.getBootstrapClassPath().getURLs();
        for (URL url : urls) {
            System.out.println(url.toExternalForm());
        }

        // 从上面路径中,随意选择一个类,来看看他的类加载器是什么:得到的是null,说明是  根加载器
        ClassLoader classLoader = Provider.class.getClassLoader();
    }
}

得到的结果

*********启动类加载器************
file:/E:/Software/JDK1.8/Java/jre/lib/resources.jar
file:/E:/Software/JDK1.8/Java/jre/lib/rt.jar
file:/E:/Software/JDK1.8/Java/jre/lib/sunrsasign.jar
file:/E:/Software/JDK1.8/Java/jre/lib/jsse.jar
file:/E:/Software/JDK1.8/Java/jre/lib/jce.jar
file:/E:/Software/JDK1.8/Java/jre/lib/charsets.jar
file:/E:/Software/JDK1.8/Java/jre/lib/jfr.jar
file:/E:/Software/JDK1.8/Java/jre/classes
null

关于ClassLoader

ClassLoader 类,它是一个抽象类,其后所有的类加载器都继承自 ClassLoader(不包括启动类加载器)

方法名称 概述
getParent() 返回该类加载器的超类加载器
loadClass(Sting name) 加载名称为 name 的类,返回结果为 java.lang.Class 类的实例
findClass(String name) 查找名称为 name 的类,返回结果为 java.lang.Class 类的实例
findLoadedClass(String name) 查找名称为 name 的已经被加载过的类,返回结果为 java.lang.Class 类的实例
defineClass(String name,Byte[] b,int off,int len) 把字节数组 b 中的内容转换为一个 Java 类,返回结果为 java.lang.Class 类的实例
resolveClass(Class<?> c) 连接指定的一个 Java 类

sun.misc.Launcher 它是一个 java 虚拟机的入口应用

获取 ClassLoader 的途径

  • 方法一:获取当前 ClassLoader
    clazz.getClassLoader()

一般用 clazz 表示一个类的实例,而 class 只是个关键字

  • 方法二:获取当前线程上下文的 ClassLoader
    Thread.currentThread().getContextClassLoader()
  • 方法三:获取系统的 ClassLoader
    ClassLoader.getSystemClassLoader()
  • 方法四:获取调用者的 ClassLoader
    DriverManager.getCallerClassLoader()

双亲委派机制

Java 虚拟机对 class 文件采用的是按需加载的方式,也就是说当需要使用该类时才会将它的 class 文件加载到内存生成 class 对象。而且加载某个类的 class 文件时,Java 虚拟机采用的是双亲委派模式,即把请求交由父类处理,它是一种任务委派模式。

理解:其实这么做的理由很简单,当我们面对一棵类继承树的时候,叶子节点可以很方便的找到其对应的根节点,而根节点要找到某一个叶子节点就需要遍历整棵树了。

工作原理

  1. 如果一个类加载器收到了类加载请求,它并不会自己先去加载,而是把这个请求委托给父类的加载器去执行;
  2. 如果父类加载器还存在其父类加载器,则进一步向上委托,依次递归,请求最终将到达顶层的启动类加载器;
  3. 如果父类加载器可以完成类加载任务,就成功返回,倘若父类加载器无法完成此加载任务,子加载器才会尝试自己去加载,这就是双亲委派模式。

类比:感觉有点像创建子类对象的时候,会向上委托,先构造父类,再构造子类。
详情可参考:各种代码块的执行顺序

双亲委派机制举例

当我们加载 jdbc.jar 用于实现数据库连接的时候,首先我们需要知道的是 jdbc.jar 是基于 SPI 接口进行实现的,所以在加载的时候,会进行双亲委派,最终从根加载器中加载 SPI 核心类,然后在加载 SPI 接口类,接着在进行反向委派,通过线程上下文类加载器进行实现类 jdbc.jar 的加载。

双亲委派机制的优势

通过上面的例子,我们可以知道,双亲机制可以

  • 避免类的重复加载
  • 保护程序安全,防止核心 API 被随意篡改
    • 自定义类:java.lang.String
    • 自定义类:java.lang.ShkStart(报错:阻止创建 java.lang 开头的类)

沙箱安全机制

沙盒(英语:sandbox,又译为沙箱),计算机术语,在计算机安全领域中是一种安全机制,为运行中的程序提供的隔离环境。

自定义 String 类,但是在加载自定义 String 类的时候会率先使用引导类加载器加载,而引导类加载器在加载的过程中会先加载j dk 自带的文件(rt.jar 包中 java\lang\String.class),报错信息说没有 main 方法,就是因为加载的是 rt.jar 包中的 String 类。这样可以保证对 Java 核心源代码的保护,这就是沙箱安全机制

FAQ

[为什么要双亲委派 不能直接从上到下加载_百度搜索 (baidu.com)](https://www.baidu.com/s?ie=UTF-8&wd=为什么要双亲委派 不能直接从上到下加载)
双亲委派为何不直接从Bootstrap classLoader,从上至下委派_白_的博客-CSDN博客
java class 类加载过程,为什么要双亲委派机制(上)_new hilbert()的博客-CSDN博客

  • 双亲委派为何不直接从Bootstrap classLoader,从上至下委派?
    答:如果你有多个自定义类加载器,那么直接从bootstrap上到下,这平级的几个自定义类加载器,你就无法选择了。

理解:这是一个树形图,我们可以很容易的从叶子结点找到其对应的根节点,但是我们很难从根节点找到我们所需的叶子结点(需要遍历一遍)。

  • 双亲委派机制的好处,为什么要从BootStrapClassLoader 开始加载,而不是从AppClassLoader 开始加载有什么问题?为什么开头是AppClassLoader 但是要往上找,而不是先从自身开始找。
    答:BootStrapClassLoader 和AppClassLoader 加载的jar 包不一样,BootStrap
    主要是加载的是核心类,支持Java程序的启动,所以需要最先加载,但是不能放在最前面,因为后面加载不到了,加载的都是用户自定义的包,所以不能放在最前面。要让AppClassLoader放在最前面,高频使用。提高效率。(有缓存,可以防止重复加载)

其它

如何判断两个 class 对象是否相同

在JVM中表示两个 class 对象是否为同一个类存在两个必要条件:

  • 类的完整类名必须一致,包括包名。
  • 加载这个类的 ClassLoader(指 ClassLoader 实例对象)必须相同。

换句话说,在 JVM 中,即使这两个类对象(class 对象)来源同一个 Class 文件,被同一个虚拟机所加载,但只要加载它们的 ClassLoader 实例对象不同,那么这两个类对象也是不相等的。

JVM 必须知道一个类型是由启动加载器加载的还是由用户类加载器加载的。如果一个类型是由用户类加载器加载的,那么 JVM 会将这个类加载器的一个引用作为类型信息的一部分保存在方法区中。当解析一个类型到另一个类型的引用的时候,JVM 需要保证这两个类型的类加载器是相同的。

类的主动使用和被动使用

Java 程序对类的使用方式分为:王动使用和被动使用。

主动使用,又分为七种情况:

  • 创建类的实例
  • 访问某个类或接口的静态变量,或者对该静态变量赋值
  • 调用类的静态方法
  • 反射(比如:Class.forName("com.nemo.Test"))
  • 初始化一个类的子类
  • Java 虚拟机启动时被标明为启动类的类
  • JDK7 开始提供的动态语言支持:
  • java.lang.invoke.MethodHandle 实例的解析结果 REF getStatic、REF putStatic、REF invokeStatic 句柄对应的类没有初始化,则初始化

除了以上七种情况,其他使用 Java 类的方式都被看作是对类的被动使用,都不会导致类的初始化

posted @ 2020-07-19 22:09  Nemo&  阅读(511)  评论(0编辑  收藏  举报