Java源代码是如何编译，加载到内存中的？

1.前言

相信许多开发同学看过《深入理解java虚拟机》，也阅读过java虚拟机规范，书籍和文档给人的感觉不够直观，本文从一个简单的例子来看看jvm是如何工作的吧。

本文所有操作均在mac上进行。

2.示例代码

示例代码采用最常见的双重检索单例模式：

package interview.desginpattern.singletion.doublecheck;

import java.io.Serializable;

public class Singleton implements Serializable {
    private static volatile Singleton instance = null;

    private Singleton() {
    }

    public static Singleton getInstance() {
        if (instance == null) {
            synchronized (Singleton.class) {
                if (instance == null) {
                    instance = new Singleton();
                }
            }
        }

        return instance;
    }
}

3.指令

经过编译后，我们得到class文件，然后用javap命令查看相关指令

javap -c Singleton：

public class interview.desginpattern.singletion.doublecheck.Singleton implements java.io.Serializable {
  public static interview.desginpattern.singletion.doublecheck.Singleton getInstance();
    Code:
       0: getstatic     #2                  // get static instance
       3: ifnonnull     37                  // instance is null，jump 37
       6: ldc           #3                  // push class Singleton to operand stack
       8: dup                               // Duplicate the top (class Singleton) operand stack value
       9: astore_0                          // Store reference(class Singleton) into local variable
      10: monitorenter                      // synchronized start
      11: getstatic     #2                  
      14: ifnonnull     27                  // instance is null，jump 27
      17: new           #3                  // new class interview/desginpattern/singletion/doublecheck/Singleton
      20: dup                               
      21: invokespecial #4                  // Method "<init>":()V
      24: putstatic     #2                  
      27: aload_0                           // Load reference (class Singleton) from local variable
      28: monitorexit                       // synchronized end
      29: goto          37
      32: astore_1
      33: aload_0
      34: monitorexit                       // synchronized end (exception)
      35: aload_1
      36: athrow                            // throw exception
      37: getstatic     #2                  
      40: areturn
    Exception table:
       from    to  target type
          11    29    32   any
          32    35    32   any

  static {};                                // static code
    Code:
       0: aconst_null                       // Push the null object reference onto the operand stack
       1: putstatic     #2                  // set static instance
       4: return
}

有以下几点需要说明：

operand stack 即操作数栈，区别于jvm虚拟机栈，是属于栈帧（frame）中的数据结构
local variable 即本地变量，也属于栈帧中的结构
synchronized 被解析成monitorenter 和 monitorexit两条指令，并且需要处理异常情形

我们知道一般来讲jvm 运行时数据包括，pc寄存器，stack（虚拟机栈），heap，method area，运行时常量池，本地方法栈。stack 中的每一帧包括，operand stack, local variable , 和指向常量池的指针。

4.class文件

上一节中只是展示了java代码编译成class文件，包含了哪些指令，但是class文件包含的信息远远不止这些。

我们在IDEA 中使用插件 jclasslib bytecode viewer 查看 class文件具体包含哪些信息：

4.1.一般信息

这里省略了class 文件的魔法数标志，0xCAFEBABE

4.2.接口和字段

4.3.方法

<init> 方法对应Singletion的构造方法
<clinit> 方法对应Singletion.class的构造方法

我们还可以查看getInstatnce编译后的指令 (chapter 3)：

4.4.常量池

上述数据结构(4.1, 4.2, 4.3)不会存字符串字面量，而是指向常量池的引用：

4.5.属性

5.加载

加载即根据class文件创建对象/接口.

有两种加载器，分别是bootstrap class loader，和user-defined class cloader，我们可以自定义加载器，比如从网络，或者从加密的class文件中加载对象。

任何一个class/inteface 被限定名 + 类加载器唯一确定，所以jvm实现者在并发的情况下需要确保此唯一性约束。

一般而言，加载流程如下

看该文件有没有被对应的加载器进行加载
验证该文件是不是class文件，major or minor version 是否被支持
检查父类是否被加载
检查接口是否被加载

6.链接（验证，准备，解析）

验证：确保class文件结构是否正确，是否打破jvm规范

准备：给class或者interface的静态属性设置默认值（区别于显式赋值）

解析：给 symbolic references 赋予确定的值（除了 invokedynamic，其他都可以唯一确定）

7.初始化

初始化：调用class或者interface的<init>, <cinit> 方法（4.3）

8.总结

本文概述了java代码是如何加载到jvm中的，jvm有各种不同的实现（我们最熟悉的hotspot虚拟机），其中细节可能不尽相同。加载到jvm中并不代表程序生命周期的结束，运行时的情况也值得关注。

9.参考

https://docs.oracle.com/javase/specs/jvms/se8/jvms8.pdf

posted @ 2023-08-09 16:00 darcy_yuan 阅读(448) 评论(0) 编辑收藏举报

刷新页面返回顶部

darcy_yuan