【❀Java虚拟机】给我说说你对Java GC机制的理解?

JVM的运行数据区

方法区

不止是存“方法”,而是存储整个class文件的信息,JVM运行时,类加载器子系统将会提取class文件里面的类信息,并将其存放在方法区中。例如类的名称、类的类型(枚举、类、接口)、字段、方法等等。

堆(Heap)

每个应用都唯一对应一个JVM实例,而每一个JVM实例唯一对应一个堆。堆主要包括关键字new的对象实例、this指针,或者数组都放在堆中,并由应用所有的线程共享。堆由JVM的自动内存管理机制所管理,名为垃圾回收 —— GC(garbage collection)。

栈(Stack)

操作系统内核为某个进程或者线程建立的存储区域,它保存着一个线程中的方法的调用状态,它具有先进后出的特性。在栈中的数据大小与生命周期严格来说都是确定的,例如在一个函数中声明的int变量便是存储在stack中,它的大小是固定的,在函数退出后它的生命周期也从此结束。在栈中,每一个方法对应一个栈帧,JVM会对Java栈执行两种操作:压栈和出栈。这两种操作在执行时都是以栈帧为单位的。还有一些即时编译器编译后的代码等数据。

PC寄存器

pc寄存器用于存放一条指令的地址,每一个线程都有一个PC寄存器。

本地方法栈

用来调用其他语言的本地方法,例如 C/C++写的本地代码, 这些方法在本地方法栈中执行,而不会在Java栈中执行。

初识GC

自动垃圾回收机制,简单来说就是寻找Java堆中的无用对象。

如何确定需要回收的垃圾对象?有引用计数法可达性分析法Java采用的是可达性分析法。基本思想就是选定一些对象作为 GC Roots,并组成根对象集合,然后从这些作为 GC Roots的对象作为起始点,搜索所走过的引用链(ReferenceChain)。如果目标对象到 GC Roots是连接着的,我们则称该目标对象是可达的,如果目标对象不可达,则说明目标对象是可以被回收的对象。

作为 GC Root的对象可以主要分为四种:

  • 虚拟机栈中引用的对象;
  • 方法区中,静态属性引用的对象;
  • 方法区中,常量引用的对象;
  • 本地方法栈中,JNI(即Native方法)引用的对象;

在 JDK1.2之后,Java将引用分为强引用、软引用、弱引用、虚引用4种,这4种引用强度依次减弱。

分代与GC机制

JVM的内存被分为了三个主要部分:新生代,老年代和永久代。

新生代

所有新产生的对象全部都在新生代中, Eden区保存最新的对象,有两个SurvivorSpace —— S1和 S0,三个区域的比例大致为 8:1:1。当新生代的Eden区满了,将触发一次 GC,我们把新生代中的GC称为 minor gc。minor gc是一种 Stop the world事件。

当eden区满了,触发minor gc,这时还有被引用的对象,就会被分配到S0区域,剩下没有被引用的对象就都会被清除。

再一次GC时,S0区的部分对象很可能会出现没有引用的,被引用的对象以及S0中的存活对象,会被一起移动到S1中。eden和S0中的未引用对象会被全部清除。

接下来就是无限循环上面的步骤了,当新生代中存活的对象超过了一定的【年龄】,会被分配至老年代的Tenured区中。这个年龄可以通过参数MaxTenuringThreshold设定,默认值为15。

新生代管理内存采用的算法为复制算法( CopyingGC),也叫标记-复制法,原理是把内存分为两个空间:一个From空间,一个To空间,对象一开始只在From空间分配,To空间是空闲的。GC时把存活的对象从From空间复制粘贴到To空间,之后把To空间变成新的From空间,原来的From空间变成 To空间。

  • 首先标记不可达对象。
  • 然后移动存活的对象到 to区,并保证他们在内存中连续
  • 清扫垃圾。

老年代

老年代用来存储存活时间较长的对象,老年代区域的GC是major gc,老年代中的内存不够时,就会触发一次。这也是一个Stop the world事件,但是看名字就知道,这个回收过程会相当慢,因为这包括了对新生代和老年代所有对象的回收,也叫 Full GC。

老年代管理内存最早采用的算法为标记-清理算法,这个算法很好理解,结合GC Root的定义,我们会把所有不可达的对象全部标记进行清除。

这个算法的劣势在于:会在标记清除的过程中产生大量的内存碎片,Java在分配内存时通常是按连续内存分配,这样我们会浪费很多内存。所以,现在的JVM GC在老年代都是使用标记-压缩清除方法,将清除后的内存进行整理和压缩,以保证内存连续。

永久代

指内存的永久保存区域,主要存放Class和Meta(元数据)的信息。

Class在被加载的时候被放入永久区域。它和和存放实例的区域不同,GC 不会在主程序运行期对永久区域进行清理。所以这也导致了永久代的区域会随着加载的Class的增多而胀满,最终抛出OOM异常。

在Java8中,永久代已经被移除,被一个称为 “元数据区”(元空间)的区域所取代。

元空间的本质和永久代类似,都是对 JVM 规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存。因此,默认情况下,元空间的大小仅受本地内存限制。类的元数据放入native memory, 字符串池和类的静态变量放入 java 堆中. 这样可以加载多少类的元数据就不再由MaxPermSize控制, 而由系统的实际可用空间来控制。

GC收集器与优化

一般而言,GC不应该成为影响系统性能的瓶颈,我们在评估GC收集器的优劣时一般考虑以下几点:

  • 吞吐量
  • GC开销
  • 暂停时间
  • GC频率
  • 堆空间
  • 对象生命周期

所以针对不同的GC收集器,我们要对应我们的应用场景来进行选择和调优,主要有4种GC收集器:Serial、 Parallel、 CMS和 G1。

Serial

Serial收集器使用了标记-复制的算法,可以用 -XX:+UseSerialGC使用单线程的串行收集器。但是在GC进行时,程序会进入长时间的暂停时间,一般不太建议使用。

Parallel

-XX:+UseParallelGC、-XX:+UseParallelOldGC

Parallel也使用了标记-复制的算法,但是我们称之为吞吐量优先的收集器,因为 Parallel最主要的优势在于并行使用多线程去完成垃圾清理工作,这样可以充分利用多核的特性,大幅降低 gc时间。当你的程序场景吞吐量较大,例如消息队列这种应用,需要保证有效利用 CPU资源,可以忍受一定的停顿时间,可以优先考虑这种方式。

CMS ( ConcurrentMarkSweep)

-XX:+UseParNewGC、-XX:+UseConcMarkSweepGC

CMS使用了标记-清除的算法,当应用尤其重视服务器的响应速度(比如 Apiserver),希望系统停顿时间最短,以给用户带来较好的体验,那么可以选择 CMS。CMS收集器在 MinorGC时会暂停所有的应用线程,并以多线程的方式进行垃圾回收。在 FullGC时不暂停应用线程,而是使用若干个后台线程定期的对老年代空间进行扫描,及时回收其中不再使用的对象。

G1(GarbageFirst)

-XX:+UseG1GC 在堆比较大的时候,如果 full gc频繁,会导致停顿,并且调用方阻塞、超时、甚至雪崩的情况出现,所以降低 full gc的发生频率和需要时间,非常有必要。G1的诞生正是为了降低 FullGC的次数,而相较于 CMS, G1使用了标记-压缩清除算法,这可以大大降低较大内存( 4GB以上) GC时产生的内存碎片。

G1提供了两种 GC模式, YoungGC和 MixedGC,两种都是 Stop The World(STW)的。YoungGC主要是对 Eden区进行 GC,minor gc不仅进行正常的新生代垃圾收集,同时也回收部分后台扫描线程标记的老年代分区。

G1将新生代、老年代的物理空间划分取消了,而是将堆划分为若干个区域(region),每个大小都为2的倍数且大小全部一致,最多有 2000个。除此之外, G1专门划分了一个 Humongous区,它用来专门存放超过一个region50%大小的巨型对象。在正常的处理过程中,对象从一个区域复制到另外一个区域,同时也完成了堆的压缩。

常用参数

-XX:+UseSerialGC:在新生代和老年代使用串行收集器
-XX:+UseParNewGC:在新生代使用并行收集器
-XX:+UseParallelGC :新生代使用并行回收收集器,更加关注吞吐量
-XX:+UseParallelOldGC:老年代使用并行回收收集器
-XX:ParallelGCThreads:设置用于垃圾回收的线程数
-XX:+UseConcMarkSweepGC:新生代使用并行收集器,老年代使用CMS+串行收集器
-XX:ParallelCMSThreads:设定CMS的线程数量
-XX:+UseG1GC:启用G1垃圾回收器

 

参考:

 

posted @ 2023-03-18 22:23  残城碎梦  阅读(23)  评论(0编辑  收藏  举报