JVM之GC算法
1. 前言
1.1 概念:清理内存中不会再被使用的对象
1.2 背景:如果内存中的垃圾不被清理,会导致内存溢出
1.3 回收区域:方法区和Java堆。【JVM的内存区域主要包括5个区域:Java栈(虚拟机栈)、本地方法栈、PC寄存器、方法区、Java堆。因为Java栈、本地方法栈、以及PC寄存器是线程专有的,当方法结束或者线程结束时,内存就自然就跟着回收了。而Java堆和方法区的内存分配和回收是动态的,正是垃圾回收器所以需要关注的部分。】
1.4 常用的垃圾回收算法:引用计数法(Reference Counting)、标记清除法(Mark-Sweep)、复制算法(Copying)、标记压缩法(Mark-Compact)、分代算法(Generational Collecting)及分区算法(Region)
2. 算法演进
2.1 引用计数法【Java垃圾回收未采用】
2.1.1 思想:对于对象A,如果被引用,A的引用计数器就+1;当引用失效时,A的引用计数器-1.当对象A的引用计数器的值为0,则对象A被回收。
2.1.2 缺陷:
2.1.2.1 无法处理循环引用的情况。【例如:对象A和对象B相互引用,却没有被其他对象引用。此时,A和B应该被回收。然而,对象A和B的引用计数器却不为0,无法被回收。】
2.1.2.2 每次对象被引用/释放引用的时候,都会伴随着运算操作,对系统性能会有一定的影响。
因为循环引用的对象无法被回收,为了解决该缺陷,于是产生了可达对象的概念。根据可达对象的概念,产生了标记清除法。
2.2 标记清除法【现代垃圾回收算法的基础】
2.2.1 基础:
2.2.1.0 在Java语言中,可作为根节点的对象包括以下几种:
a. Java栈中引用的对象
b. 方法区中静态属性以及常量引用的对象;
c. 本地方法栈中JNI(Native方法)引用的对象。
2.2.1.1 可达对象:通过根对象进行引用搜索,最终可以达到的对象。
2.2.1.2 不可达对象:通过根对象进行引用搜索,最终没有被引用到的对象。
2.2.2 思想:通过标记、清除两个阶段实现垃圾回收
2.2.2.1 标记阶段:根据根节点,标记所有的可达对象【根据根节点标记可达对象后,还会进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法。在finalize()中没有重新与引用建立关联的对象才会被真正回收。】
2.2.2.2 清除阶段:清除所有的不可达对象
2.2.3 缺陷:
2.2.3.1 产生大量的空间碎片,工作效率低
标记清除法是对一块连续的空间进行回收,回收后的空间是不连续的【如图】。在对象的堆空间分配过程中,尤其是大对象的内存分配,不连续内存空间的工作做效率要低于连续空间。
因为不连续内存空间的工作效率低,为了解决这个问题,于是想到:新开辟一个工作空间,将可达对象复制到新的内存空间,保证空间使用的连续性。
2.3 复制算法【新生代算法】
2.3.1 思想:将原有的内存空间分为两块,每次使用其中一块。垃圾回收时,将正在使用的内存中的可达对象复制到未使用的内存块中,清除正在使用的内存块中的所有对象,交换两个内存的角色,完成回收。
2.3.2 缺陷:
2.3.2.1 将系统内存折半,占用的系统内存太大。
复制算法的高效性是建立在存活对象少,垃圾对象对象多的前提下。对于存活对象多的情况,复制成本高,需要其它算法来替代。
2.4 标记压缩法【老年代算法】
2.4.1 原理:标记清除算法执行完成后,再进行一次内存碎片整理。
2.4.2 思想:从根节点出发,将所有的可达对象进行标记,然后将标记对象压缩到内存的一端。最后,清除边界之外的所有空间。
在上述算法中,它们都有各自独特的优势,并没有一种算法可以完全替代其它算法。因此,正确的方式是:根据垃圾回收对象的特性,使用合适的算法回收。基于这种情况,产生了分代的思想。
2.5 分代算法
2.5.1 思想:根据对象的特点,将内存区域分成几块;根据每块内存区域的特点,使用不同的回收算法。
2.5.2 应用:新生代使用复制算法,老年代使用标记压缩法。
既然可以根据对象的生命周期(时间角度)进行回收,那么根据对象的空间分布(空间角度)也可以进行回收。
2.6 分区算法
2.6.1 背景:在相同条件下,堆空间越大,一次GC所用的时间越长,从而产生的停顿也越长。
2.6.2 思想:将堆空间划分成连续的小区域,每个小区域独立使用、独立回收。
3. 补充
3.1 新生代串行垃圾回收器中,使用复制算法的思想。
3.1.1 基础:新生代分为eden区、from区、to区。其中,from区和to区也被称为survivor区,可以视为用于复制的大小相等、地位相等、且可以角色互换的两个空间块。
3.1.2 思路:垃圾回收时,Eden区和正在使用的survivor区(假设是from区)中的可达对象会被复制到未被使用的survivor区(to区),然后清空Eden区和from区。
3.1.3 备注:from区中的大对象或者老年对象会直接进入老年区;如果to区空间不足,对象也会进入老年区
3.2 复制算法的高效性是建立在可达对象少,不可达对象多的前提下,因此复制算法只用于新生代【新生代,垃圾对象通常会多于存活对象;老年代大部分对象都是存活对象】。老年代采用标记压缩法
3.3 新生代GC与老年代GC对比:
3.4 Java中的引用
判断对象是否存活都与“引用”有关。在Java中,引用分为四种:强引用、软引用、弱引用、虚引用。
3.4.1 强引用
是代码中普片存在的一种引用,形如:Object obj = new Object(); 只要强引用还存在,垃圾回收器就永远不会回收被引用的对象。
3.4.2 软引用
用来描述一些还有用但是非必须的对象。对于软引用关联着的对象,在系统将要发生内存溢出异常(即:内存不足)时,才会被回收。
3.4.3 弱引用
用来描述非必须对象,它的强度比软引用更弱。当GC发生时,一定会被回收(无论内存是否充足)。
3.4.4 虚引用
也叫幽灵引用或幻影引用,是最弱的一种引用。通过虚引用无法创建对象实例。它的作用是能够在这个对象被回收时收到一个系统通知。
3.5 方法区如何判断是否需要回收
方法区主要回收的内容为:废弃的常量和无用的类。对于废弃的常量可以通过引用的可达性来判断,但是对于无用的类则需要通过以下3个条件判断:
3.5.1 该类的所有实例都已经被回收
3.5.2 该类的CLassLoader已经被回收
3.5.3 该类对象的java.lang.Class对象没有在任何地方被使用(即:该类没有被反射访问)
4. 参考文献:
4.1 葛一鸣:《实战Java虚拟机 – JVM故障诊断与性能优化》
4.2 程序员内参 : 《JVM的垃圾回收机制总结》