jvm 调优(2)垃圾回收算法
可以从不同的的角度去划分垃圾回收算法:
按照基本回收策略分
引用计数(Reference Counting):
比较古老的回收算法。原理是此对象有一个引用,即增加一个计数,删除一个引用则减少一个计数。垃圾回收时,只用收集计数为0的对象。此算法最致命的是无法处理循环引用的问题。
标记-清除(Mark-Sweep):
此算法执行分两阶段。第一阶段从引用根节点开始标记所有被引用的对象,第二阶段遍历整个堆,把未标记的对象清除。此算法需要暂停整个应用,同时,会产生内存碎片。
复制(Copying):
此算法把内存空间划为两个相等的区域,每次只使用其中一个区域。垃圾回收时,遍历当前使用区域,把正在使用中的对象复制到另外一个区域中。次算法每次只处理正在使用中的对象,因此复制成本比较小,同时复制过去以后还能进行相应的内存整理,不会出现“碎片”问题。当然,此算法的缺点也是很明显的,就是需要两倍内存空间。
标记-整理(Mark-Compact):
此算法结合了“标记-清除”和“复制”两个算法的优点。也是分两阶段,第一阶段从根节点开始标记所有被引用对象,第二阶段遍历整个堆,把清除未标记对象并且把存活对象“压缩”到堆的其中一块,按顺序排放。此算法避免了“标记-清除”的碎片问题,同时也避免了“复制”算法的空间问题。
按分区对待的方式分
增量收集(Incremental Collecting):实时垃圾回收算法,即:在应用进行的同时进行垃圾回收。不知道什么原因JDK5.0中的收集器没有使用这种算法的。
分代收集(Generational Collecting):基于对对象生命周期分析后得出的垃圾回收算法。把对象分为年青代、年老代、持久代,对不同生命周期的对象使用不同的算法(上述方式中的一个)进行回收。现在的垃圾回收器(从J2SE1.2开始)都是使用此算法的。
按系统线程分
串行收集:串行收集使用单线程处理所有垃圾回收工作,因为无需多线程交互,实现容易,而且效率比较高。但是,其局限性也比较明显,即无法使用多处理器的优势,所以此收集适合单处理器机器。当然,此收集器也可以用在小数据量(100M左右)情况下的多处理器机器上。
并行收集:并行收集使用多线程处理垃圾回收工作,因而速度快,效率高。而且理论上CPU数目越多,越能体现出并行收集器的优势。
并发收集:相对于串行收集和并行收集而言,前面两个在进行垃圾回收工作时,需要暂停整个运行环境,而只有垃圾回收程序在运行,因此,系统在垃圾回收时会有明显的暂停,而且暂停时间会因为堆越大而越长。
如何分代
虚拟机中共划分出三个代,分别是 年轻代,老年代,持久代。其中持久代中主要存储的是java类的类信息和常量池。与垃圾收集要收集的java对象关系不大。年轻代和老年代的划分是对垃圾收集影响比较大的。
年轻代 :
所有新生成的对象全部放在新生代,新生代的目标就是尽可能快速的收集掉这些生命周期短的对象。年轻代分为三个区。一个Eden区,和两个Survivor区。大部分对象在Eden区中生成。当Eden区满时,还存活的对象将被复制到Survivor区(其中一个),当这个Survivor和Eden也满的时候,存活的对象将被复制到另一个Survivor区。经过多次复制还存活的对象将被复制到老年代。
老年代:
在年轻代经历了n次垃圾回收仍然存活的对象将被复制到老年代。因此可以认为,老年代存放的对象都是生命周期较长的对象。
持久代
用于存放静态问题,如java类和方法,常量池。持久代对垃圾回收没有显著影响。
什么情况下会触发垃圾回收
因为对象进行了分代处理,因此垃圾回收的区域,时间不一样。GC分为两张,一种是Scavenge GC 和 Full GC
Scavenge GC
一般情况下,当新对象生成,并且在Eden申请空间失败时,就会触发Scavenge GC,对Eden区域进行GC,清除非存活对象,并且把尚且存活的对象移动到Survivor区。然后整理Survivor的两个区。这种方式的GC是对年轻代的Eden区进行,不会影响到年老代。因为大部分对象都是从Eden区开始的,同时Eden区不会分配的很大,所以Eden区的GC会频繁进行。因而,一般在这里需要使用速度快、效率高的算法,使Eden去能尽快空闲出来。
Full GC
对整个堆进行整理,包括新生代,老年代和持久代。Full GC要对整个堆进行整理,因此要比Scvaenge GC慢,因此应该尽可能的减少Full GC 的次数。在对JVM调优的工作中,很大一部分就是对Full GC的调节。
不同的垃圾回收器
串行处理器
试用情况:数据量比较小(100M左右);单处理器下并且对响应的时间无要求的应用
缺点:只能用于小型应用
并行处理器
试用情况:对吞吐量有高要求,多CPU、对响应时间无要求的大中型应用
缺点:垃圾收集过程中应用响应时间可能加长
并发处理器
试用情况:对响应时间有高要求,多CPU、对响应时间有高要求的大中型应用。如Web服务器/应用服务器、电信交换、集成开发环境。