JVM 对象的创建

对象的创建
对象的内存布局
对象的访问定位
- 句柄
- 直接指针

HotSpot 虚拟机在 Java 堆中对象分配、布局和访问的全过程。

对象的创建

类加载

虚拟机遇到一条 new 指令时，首先将去检查这个指令的参数，是否能在运行时常量池中定位到这个类的符号引用，并且检查这个符号引用代表的类是否已被加载过、连接和初始化过。

如果没有，那必须先执行相应的类加载过程。

分配内存

在类加载检查通过后，接下来虚拟机将为新生对象分配内存。对象所需的内存大小在类加载完成后便可确定，为对象分配空间的任务，等同于把一块确定大小的内存从 Java 堆中划分出来。

分配方式有 “指针碰撞” 和 “空闲列表” 两种，选择哪种分配方式由 Java 堆是否规整决定，而 Java 堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定。

内存分配的两种方式

指针碰撞
- 适用场合：堆内存规整的情况（即没有内存碎片）
- 原理：用过的内存全部整合到一边，没有用过的内存放在另一边，中间有一个分界指针，只需要向着没用过的内存方向将该指针移动对象内存大小位置即可。
- 对应的 GC 收集器：Serial、ParNew
- 对应的 GC 算法：复制算法
空闲列表
- 适用场合：堆内存不规整的情况
- 原理：虚拟机会维护一个列表，该列表中会记录哪些内存块是可用的，在分配的时候，找一块儿足够大的内存块儿来划分给对象实例，最后更新列表记录。
- 对应的 GC 收集器：CMS
- 对应的 GC 算法：标记清除

选择以上两种方式中的哪一种，取决于 Java 堆内存是否规整。

Java 堆内存是否规整，取决于 GC 收集器的算法是"标记-清除"，还是"标记-整理"（也称作"标记-压缩"），值得注意的是，复制算法内存也是规整的。

内存分配并发问题

在创建对象的时候有一个很重要的问题，就是线程安全，因为在实际开发过程中，创建对象是很频繁的事情，作为虚拟机来说，必须要保证线程是安全的。

一般情况下，虚拟机采用两种方式来保证线程安全：

CAS + 自旋

CAS 是乐观锁的一种实现方式。所谓乐观锁就是，每次不加锁而是假设没有冲突而去完成某项操作，如果因为冲突失败就重试，直到成功为止。

虚拟机采用 CAS + 失败重试的方式，保证更新操作的原子性。
线程本地分配缓存（Thread Local Allocation Buffer，TLAB）

TLAB 是一块线程专用的内存分配区域，占用的是 eden 区的空间。

JVM 在给线程中的对象分配内存时，首先在 TLAB 分配，当对象大于 TLAB 中的剩余内存，或 TLAB 的内存已用尽时，再采用上述的 CAS 进行内存分配。

局限性： TLAB空间一般不会太大，所以，大对象无法进行 TLAB 分配，只能直接分配到堆 Heap 上。

由于对象一般分配在堆上，而堆是线程共用的，因此可能会有多个线程在堆上申请空间，而每一次的对象分配都必须线程同步，会使分配的效率下降。考虑到对象分配几乎是 Java 中最常用的操作，因此 JVM 使用了 TLAB 这样的线程专有区域来避免多线程冲突，提高对象分配的效率。

初始化零值

内存分配完成后，虚拟机需要将分配到的内存空间中的数据类型都初始化为零值（不包括对象头），这一步操作保证了对象的实例字段在 Java 代码中可以不赋初始值就直接使用，程序能访问到这些字段的数据类型所对应的零值。

设置对象头

初始化零值完成之后，虚拟机要对对象进行必要的设置，例如，这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的 GC 分代年龄等信息，这些信息存放在对象头中。

另外，根据虚拟机当前运行状态的不同，例如，是否启用偏向锁等，对象头会有不同的设置方式。

执行 init 方法

在上面工作都完成之后，从虚拟机的视角来看，一个新的对象已经产生了，但从 Java 程序的视角来看，对象创建才刚开始，<init> 方法还没有执行，所有的字段都还为零。所以一般来说，执行 new 指令之后会接着执行 <init> 方法，把对象按照程序员的意愿进行初始化，这样一个真正可用的对象才算完全产生出来。

对象的内存布局

在 Hotspot 虚拟机中，对象在内存中的布局可以分为 3 块区域：对象头、实例数据和对齐填充。

Hotspot 虚拟机的对象头，包括两部分信息：
- 第一部分，是用于存储对象自身的运行时数据：哈希码、GC 分代年龄、锁状态标志等等；
- 另一部分，是类型指针，即对象指向它的类元数据的指针，虚拟机通过这个指针来确定这个对象是哪个类的实例。
实例数据部分：是对象真正存储的有效信息，也是在程序中所定义的各种类型的字段内容。
对齐填充部分：不是必然存在的，也没有什么特别的含义，仅仅起占位作用。

因为 Hotspot 虚拟机的自动内存管理系统要求对象起始地址必须是 8 字节的整数倍，也说就是对象的大小必须是 8 字节的整数倍。而对象头部分正好是 8 字节的倍数（1 倍或 2 倍），因此，当对象实例数据部分没有对齐时，就需要通过对齐填充来补全。

对象的访问定位

创建好对象后，访问对象的时候，Java 程序通过栈上的 reference 数据，来操作堆上的具体对象。

JVM 规范未规定对象的访问方式，对象的访问方式由虚拟机实现而定。目前主流的访问方式有：句柄、直接指针。

这里，我们需要区分两个概念：

对象实例数据：即 new 出来的对象信息，包含对象头，实例数据和对齐填充。
对象类型数据：对象实例对应的类的相关信息，即 Class 信息，如，对象的类型、父类、实现的接口、方法等，保存在方法区。通过到对象类型数据的指针访问访问方法区中的对象类型数据。

通过实例引用调用实例方法的时候，先通过对象实例数据，找到对应的方法区中的对象类型数据中找，找不到的话再去父类类型信息中找。

句柄

果使用句柄的话，那么 Java 堆中将会划分出一块内存来作为句柄池，reference 中存储的就是对象的句柄地址，而句柄中包含了对象实例数据与对象类型数据各自的具体地址信息。

优点：reference 中存储的是稳定不变的句柄地址。

当进行垃圾回收的时候，如果对象被移动（内存地址发生变动），只需要更改堆中句柄池中句柄的地址，栈上的 reference 不需要进行更改。
缺点：每次访问一个对象，需要进行三次指针定位。

通过 reference 访问句柄池中的句柄，需要一次指针定位；访问对象实例数据，需要一次指针定位；访问对象类型数据，需要一次指针定位。

直接指针

reference 中存储的是对象的地址，对象实例数据中存储类型的指针地址。

每次访问一个对象，只需要进行两次指针定位：通过栈上 reference 访问句柄池中的句柄，需要一次指针定位；访问对象类型数据，需要一次指针定位。

优点：和句柄的方式比，最大的好处就是速度快，节省了一次对象实例指针定位的时间开销。

因为对象的访问在 Java 中非常频繁，这类开销多了后是非常可观的执行成本。
缺点：进行GC回收的时候，对象存储位置如果在堆上发生变动，栈上reference上的地址将发生变动。

普遍使用的 Hot Spot 虚拟机，使用的就是直接指针的方式。

参考：

posted @ 2023-10-27 09:49 LARRY1024 阅读(219) 评论(0) 收藏举报

刷新页面返回顶部

LARRY1024