内存垃圾收集算法
内存垃圾收集算法
这里的内存主要指的堆和方法区的内存。
一、如何判断对象是否死亡
引用计数算法
在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1,当引用失效时,计数器就减1,任何时刻计数器为零的对象就是不可能再被使用的。比较著名的应用案例有微软com技术、python语言等,但是在Java领域,主流的Java虚拟机里面都没有选用引用计数器算法来管理内存,主要原因是这个看似简单的算法有很多例外的情况需要考虑,必须配合大量额外处理才能保证准确的工作,譬如对象之间的相互循环引用。
可达性分析算法
基本思路是通过一系列成为gc roots的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索走过的路径称为“引用链”,如果某个对象到gc roots没有任何引用链相连,或者用图论的话来说就是从gc roots到这个对象不可达时,则证明此对象时不可能再被使用的。
在Java技术体系里面,固定可作为gc roots的对象包括如下几种:
1、在虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等。
2、方法区中类静态属性引用的对象,譬如Java类的引用类型静态变量。
3、方法区中常量引用的对象,譬如字符串常量池里面的引用。
4、在本地方法栈中jni引用的对象。
5、Java虚拟机内部的引用,如基本数据类型对应的class对象,一些常驻的异常对象,还有系统类加载器。
6、所有被同步锁持有的对象。
7、反应Java虚拟机内部情况的jmxbean,jvmti中注册的毁掉、本地代码缓存。
二、引用分类
在jdk1.2版之后,Java对引用的概念进行了扩充将引用分为了4种引用,引用强度依次逐渐减弱。增加分类是为了扩充引用的语义,来描述哪些“食之无味、弃之可惜”的对象,例如在内存中可有可无的对象--在内存够的时候就保留在虚拟机,不够的时候就释放掉。
1、强引用-- 值的是程序代码之中普遍存在的引用赋值,即类似:object obj = new object()。无论任何情况下,只要强引用关系存在,垃圾收集器就永远不会回收掉被引用的对象。
2、软引用-- 描述一些还有用, 但是非必须的对象。只被软引用关联的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收,如果这次回收还没有足够的内存才会抛出异常。
3、弱引用是用来描述一些还有用,但是非必须的对象。他的强度比软引用更弱,被弱引用关联的对象只能生存到下一次垃圾收集发生为止。
4、虚引用也被称为“幽灵引用”,他是最弱的一种引用关系,为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时收到一个系统通知。
三、对象死亡
在可达性分析算法中判定为不可达的对象,也不是“非死不可”的,这时候他们还处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历俩次标记过程:
如果对象在进行可达性分析后发现没有与gc roots相连接的引用链,那么他将会被第一次标记,随后进行一次筛选,筛选的条件是此对象是否有必要执行finalize方法,
假如对象没有覆盖这个方法或者该方法已经被调用过,那么都不需要再次执行finalize方法。
如果对象需要执行finalize方法,那么该对象会被放置在一个名为f-queue的队列中,并在之后会建立一个线程去执行他们的finalize方法,但是并不一定会等待它运行结束,这样做时为了防止阻塞死循环等。
四、回收方法区
方法区的垃圾收集主要回收的俩部分的内容,废弃的常量和不再使用的类型。类型卸载的条件比较苛刻。
五、垃圾收集算法
1、分代收集理论
- 弱分代假说:绝大多数对象都是朝生夕死的
- 强分代假说:熬过越多次垃圾收集过程的对象就越难以消亡。
这俩个分代假说共同奠定了常用垃圾收集器一致的设计原则:收集器应该将Java堆划分出不同的区域,然后将回收对象依据其年龄分配到不同的区域存储。
即朝生夕死的一个区域,难以消亡的一个区域。
关于跨代引用:跨代引用假说:跨代引用相对于同代引用来说进占极少数。
为了解决在对象存在跨代引用时的对象扫描,只需要在新生代上建立一个全新的数据结构(记忆集),这个结构把老年代划分成若干个小块,标识出老年代的那一块内存会存在跨代引用。
此后当发生minor gc时,只有包含了跨代引用的小块内存里的对象才会被加入到gc roots进行扫描。
2、标记-清除算法
算法分为标记和清除俩个阶段:首先标记出所有需要回收的对象,在标记完成之后,统一回收掉所有被标记的对象,也可以反过来,标记存活的对象,统一回收所有未被标记的对象。
缺点:1、执行效率不稳定,标记和清除的过程执行效率随着对象数据增长而降低。2、内存空间碎片化的问题。
3、标记-复制算法
一开始提出的标记-复制算法,将可用的内存按容量划分为大小相同的俩块,每次只使用其中的一块内存,当这块内存快满的时候,就将存活的对象复制到另外一块上,
这种算法会产生大量的内存复制开销,如果多数对象可回收,那么该算法只需要复制少数的对象就可以了。回收之后,也没有空间碎片的问题,但是这种算法的代价是将原来可用的内存缩小为原来的一半,空间浪费有点多。
后来andrew apple提出来一个更优化的半区复制分代策略,apple式回收的具体做法是把新生代分为一块较大的eden空间和俩块较小的survivor空间,每次内存分配只使用eden和其中一块survivor空间,发生垃圾收集时,将eden和survivor中仍然存活的对象一次性复制到另外一块survivor空间上,然后直接清理掉eden和已用过的那块sruvivor空间。hotspot虚拟机默认的eden和survivor的小大比为8:1。如果在垃圾回收的时候,一块survivor空间不足以放下存活的对象,那么就要依赖其他区域进行分配担保。直接进入老年代。
4、标记-整理算法
标记-复制算法在对象存活率较高时就要进行较多的复制操作,效率将会降低。还有浪费一部分空间的问题,分配担保等问题,所以一般在老年代中一般不能直接选用这种算法。
标记整理算法其中的标记过程和标记-清除算法一样,但是后续步骤不是直接对可回收的对象进行清理,而是让所有存活的对象都想空间的一端移动。然后直接清理掉边界为外的内存。
对标记整理算法和标记清除算法而言,是否移动对象都存在弊端,移动则内存回收时会更复杂,不移动则内存分配时会更复杂。从垃圾收集的停顿时间来看,不移动对象停顿的时间会更短,甚至可以不停顿,但是从吞吐量来看,移动对象会更划算。
hotspot虚拟机中,关注吞吐量的parallel scavenge收集器时基于标记整理的,cms收集器时基于标记-清除算法的,而在空间碎片较多的时候,会进行一次标记-整理。
参考《深入理解Java虚拟机》 周志明