JVM垃圾回收
JVM垃圾回收机制
一、回收之前需要先判断都有哪些对象是可以回收的
1、引用计数法
引用计数法是垃圾收集早期的算法,当当前对象被引用时,其内部变量的值会加1,解除引用时,内部变量的值会减1,当需要进行垃圾回收时,只回收内部变量为0的对象。
优点:引用计数法可以很快的执行,在程序需要不被长时间打断的情况下比较有利
缺点:当两个对象相互引用时,这两个对象将永远不会被回收,不能解决循环引用的情况
2、可达性分析法
2.1、可达性分析法是从一个GC ROOT节点开始,寻找对应的引用的节点,找到这个节点之后,在寻找这个节点的引用节点,当所有的引用节点查找完毕后,剩余的节点则被认为是没有被引用的节点,也就是无用节点,会被垃圾收集器回收。
在java语言中,可以被作为GC ROOT的对象包括以下几种:
1、虚拟机栈中引用的对象
2、方法区中类静态属性引用的对象
3、方法区中常量引用的对象
4、本地方法栈中的JNI(Natavi方法)引用的对象。
java语言中引用的几种方式:
强引用:类似于Object obj = new Object();只要强引用还在,就永远不会被垃圾回收器回收
软引用:用来描述一些有用但是非必须的对象。当将要发生内存溢出的异常时,会先回收软引用的对象,当回收完成后发现内存还是不足,则会抛出内存溢出的异常。
弱引用:弱引用的生命周期在下一次垃圾回收之前。
虚引用:这是最弱的一种引用关系,这类引用是无法获取一个对象实例的,它的作用是在这个对象被垃圾收集器回收时会接到一个系统通知。
总结:无论是引用计数法还是可达性分析法,都是针对的强引用
疑问1:利用可达性分析法被标记无任何引用的对象会一定会被回收吗?
答案是不一定,在对象真正被回收之前还会经历两次标记的过程。第一次标记:当对象被可达性分析法判定与GC ROOT没有任何引用关系时,会对对象进行第一次标记。第二次标记:在被第一次标记后会进行第二次筛选,筛选的条件是是否有必要执行finalize()方法,在finalize()方法中没有与引用链重新建立联系的,则会被进行第二次标记。当对象被第二次标记成功后,则会被垃圾收集器回收。
疑问2:方法区如何判断是否需要回收?
方法区回收主要回收废弃的常量和无用的类,废弃的常量也可以用可达性分析法,但是对于无用的类需要满足三个条件才会被回收,第一个是该类的所有实例都已经被回收,也就是java堆中不存在该类的任何实例;第二个是加载该类的classLoader已经被回收;第三个是该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
以上是回收之前如何判断哪些对象需要被回收的算法,接下来就是知道哪些对象需要被回收之后,应用哪些算法进行回收了!!!
二、常见的垃圾回收算法
1、标记-清除算法
标记-清除算法是采用从根集合GC ROOT进行扫描,对存活的对象进行标记,标记完成后,在扫描整个空间中未被标记的对象,进行回收。
优点:存活对象比较多的时候,效率很高
缺点:因为是对未被标记的对象进行回收,会造成内存碎片。
2、复制算法
复制算法是为了克服句柄的开销和内存碎片。也是从根集合GC ROOT开始扫描对象,并将每个存活的对象复制到空闲面,这样就避免产生内存碎片。
优点:不会产生内存碎片。
缺点:存活对象较多时效率相对不高。
3、标记-整理算法
标记-整理算法是在标记-清除算法之上进行的扩展。同样都是采用标记被回收的对象的方式,但是在清除时,在回收不存活的对象的空间后,会将所有的存活对象往左端空闲区域移动,并更新对应的指针。所以标记-整理算法在标记-清除的算法之上又增加了对象的移动,因为成本更高了,但是解决了内存碎片的问题。
优点:不会产生内存碎片。
缺点:效率低。
4、分代收集算法
分代收集是目前大部分虚拟机的垃圾收集器采用的算法。它的核心思想就是根据对象存活的生命周期划分为多个不同的区域。一般情况下将堆区划分为老年代,和新生代。在堆区之外还有一个永久代。而老年代特点:每次回收时只有少量的对象被回收。新生代特点:每次垃圾收集时都有大量的对象被回收,所以可以根据不同代的特点来选择合适的收集算法。
4.1、年轻代的收集算法
a、所有新生成的对象都是存放在年轻代的。年轻代的目标就是尽可能快速的收集掉那些生命周期短的的对象。
b、新生代内存按照8:1:1分为一个eden区和两个survivor(survivor0、survivor1)区(一般情况下分为这两个区)。大部分对象都是在eden中生成。回收时现将eden区中存活的对象复制到survivor0区中,然后清空eden区,当survivor0区中满了时,会把eden区和survivor0中的存活的对象复制到survivor1区中,然后清空eden区和survivor0区,此时survivor0区是空的,然后将survivor0和survivor1区进行交换,既保持survivor1区为空,如此反复。
c、当survivor1区不足以存放 eden和survivor0的存活对象时,就将存活对象直接存放到老年代。若是老年代也满了就会触发一次Full GC,也就是新生代、老年代都进行回收。
d、新生代发生的GC也叫做Minor GC,MinorGC发生频率比较高(不一定等Eden区满了才触发)。
4.2、老年代的收集算法
a、在年轻代中经历了N次垃圾回收后仍然存活的对象,就会被放到年老代中。因此,可以认为年老代中存放的都是一些生命周期较长的对象。
b、内存比新生代也大很多(大概比例是1:2),当老年代内存满时触发Major GC即Full GC,Full GC发生频率比较低,老年代对象存活时间比较长,存活率标记高。
4.3、持久代的收集算法
用于存放静态文件,如Java类、方法等。持久代对垃圾回收没有显著影响,但是有些应用可能动态生成或者调用一些class,例如Hibernate 等,在这种时候需要设置一个比较大的持久代空间来存放这些运行过程中新增的类。持久代也称方法区,具体的回收可参见上面疑问2。
三、常见的垃圾回收器
Serial收集器(复制算法)
新生代单线程收集器,标记和清理都是单线程,优点是简单高效。是client级别默认的GC方式,可以通过-XX:+UseSerialGC来强制指定。
Serial Old收集器(标记-整理算法)
老年代单线程收集器,Serial收集器的老年代版本。
ParNew收集器(停止-复制算法)
新生代收集器,可以认为是Serial收集器的多线程版本,在多核CPU环境下有着比Serial更好的表现。
Parallel Scavenge收集器(停止-复制算法)
并行收集器,追求高吞吐量,高效利用CPU。吞吐量一般为99%, 吞吐量= 用户线程时间/(用户线程时间+GC线程时间)。适合后台应用等对交互相应要求不高的场景。是server级别默认采用的GC方式,可用-XX:+UseParallelGC来强制指定,用-XX:ParallelGCThreads=4来指定线程数。
Parallel Old收集器(停止-复制算法)
Parallel Scavenge收集器的老年代版本,并行收集器,吞吐量优先。
CMS(Concurrent Mark Sweep)收集器(标记-清理算法)
高并发、低停顿,追求最短GC回收停顿时间,cpu占用比较高,响应时间快,停顿时间短,多核cpu 追求高响应时间的选择。