java垃圾回收机制
一 概述
1.垃圾
JVM垃圾收集针对的是主要是堆中的垃圾,因为线程启动时在栈中分配空间,线程结束,自动释放空间,不需要实时监控;方法区主要存储类信息以及静态变量与常量,通常在整个程序运行期间都有效,不存在需要回收的对象。
垃圾指的是无法被线程访问的对象,一个对象只有对线程可见,可被线程访问,才可用,也可以简单理解为没有任何引用的对象。严格来说,没有任何引用对象的表述缩小了垃圾的范畴,比如在循环引用中,一个对象A引用了另一个对象B,对象B又引用了A,A与B的引用关系仅存在于两者之间,没有任何一个外界对象引用A或者B,那么A与B就无法被纳入程序运行之中,即不能被任何一个线程访问,就成了无用对象,按照定义垃圾的动机,不再被使用的对象即为垃圾,A与B自然就属于垃圾。
有时也将垃圾称作无用对象,非垃圾称作存活对象。
2.内存泄漏
无用对象持续占有内存导致内存浪费的现象叫做内存泄漏。内存泄漏的根本原因是长生命周期的对象使用完毕后依然持有短生命周期对象的引用,比如下面的代码:
public void test02(){ Object obj = new Object(); obj.doSome();//调用了对象中的doSome方法以后,就不再使用该对象,但是依然持有对象的引用obj ...................... }
在方法中创建了一个对象,创建对象的目的只是为了访问对象中的方法doSome,方法访问完毕,就不再访问对象,而此时引用变量obj依然指向该对象,既然对象存在引用,该对象就不会被视作垃圾,但对象已经变成无用对象,应该解除引用,以便垃圾回收器回收该对象占用的内存空间,“obj=null;”解除引用。
3.内存回收
垃圾回收器回收的不是对象,而是无用对象占用的内存空间,以使空间可以被再次使用。
4.内存碎片
在内存分配与回收过程中产生的较小的、不连续的可用空间,如图所示:
由于等待回收的空间分散排列,回收完成以后,可用空间被已用空间分割成一个个独立的小单元,由于这些单元体积很小,无法存放大的数据,需要为大的数据另外开辟空间,就造成了内存浪费。
二 确定垃圾的算法
1.引用计数算法
对象创建时给对象添加一个引用计数器,每当有一个变量引用该对象,计数器就加1,变量释放了引用,计数器减1,任何时刻计数器为0,就意味着没有对象引用该对象,对象成了垃圾。
引用计数算法的天生缺陷是,无法解决循环引用问题,即循环引用的两个对象即使不再被使用,依然被视作可用对象,不会被垃圾回收器回收。JVM垃圾回收机制采用的不是该算法,而是下面的可达性分析算法。
2.可达性分析算法
可达性分析算法采用追踪方式判断对象是否存活,任何可被追踪即可到达的对象都是存活对象,不可追踪即不可到达的对象都是无用对象。追踪的起点是当前正在被访问的任何一个对象,从该对象出发,找到该对象引用的对象,依次循环,形成一个引用链,不在引用链上的对象就是不被线程使用的对象,就是垃圾。如下图,左侧形成了一条引用链,链上的所有对象都是存活对象,右侧对象虽然相互之间存在引用关系,脱离线程的引用链,因此是无用对象。
这种分析是动态的,而非静态的,随着对象引用关系的变化而变化。
三 对象存储划分
不同对象的生命周期不同,为了及时回收内存,对生命周期短的对象频繁执行垃圾收集操作,而生命周期长的对象比较稳定,可以长期存在,垃圾收集扫描次数少,因此为了节省开销,降低垃圾收集次数,将不同生命周期的对象分别存储于内存的不同区域,以便采用不同的垃圾收集策略。
JVM将对象的存储空间分为三个区:新生代、老年代、永久代。
1.新生代
设立新生代是为了快速回收生命周期短的对象,所有新生成的对象首先放在新生代中。新生代分为3部分:eden、from survivor、to survivor,空间比例为8:1:1。
新创建的对象首先放在eden,执行多次gc(垃圾收集),eden区满了以后,那些还存活的对象会被转移到from survivor区,from survivor满了以后,存活的对象被转移到to survivor,to surviror区满了以后,存活的对象就被提升到老年代。
JVM对年轻代中的对象频繁执行gc,绝大多数对象会在年轻代被回收,很少一部分进入老年代。
2.老年代
老年代中的对象都是经过多次gc存活下来的对象,生命周期较长,比较稳定,因此执行gc操作次数较少。
3.永久代
永久代也就是方法区,存储的是类信息以及静态变量与常量,生命周期与应用程序相同,一般不需要垃圾收集器处理。
四 垃圾收集算法
垃圾收集算法是垃圾确认以后实际收集时采用的算法,常见的算法有3种:
1.标记-清除方法
先标记无用对象,然后回收对象占用的内存空间,会导致内存碎片,基本不采用该算法。
2.复制算法
将内存空间分为多个区域,垃圾收集时将一个区域内的存活对象全部复制到另一个区域,然后清空该区域,这样就不会产生内存碎片。新生代垃圾收集时采用该算法,从eden的区复制到from survivor区,再复制到to survivor区,因为存活对象较少,复制时占用空间较少。
3.标记-整理算法
首先标记需要清除的对象,将所有存活对象移动到一端,然后清除所有无用对象。老年代不像新生代,每次gc之后存活对象较多,采用复制算法占用内存较大,采用“标记-整理”算法既节省了内存,又不会导致内存碎片。
五 垃圾收集时机
不同的代有不同的gc机制:Scavenge GC与Full GC。
当新生代eden区域已满,新生成的对象申请空间失败,会触发Scavenge GC,对eden区域进行gc操纵,清除无用对象,腾出空间。Scavenge GC只对新生代起作用。
当老年代已满或者持久代已满,或者显式调用了System.gc()方法,会触发Full GC,对所有对象存储区域进行gc,资源耗费较大,应该较少Full GC次数。
六 其他方法
1.System.gc()
告知JVM启动垃圾回收器,垃圾回收器采用守护线程,不一定立即启动,具体何时启动无法控制。另外资源消耗大,一般情况下不要显式调用。
2.finalize()
对象范围的方法。在JVM确认一个对象无法被访问后调用,只能被调用一次,通常用来释放连接资源。该方法被调用后,垃圾回收器不会立即回收对象占用的空间,因为该方法执行过程中,对象可能重新被访问,而是在下一次gc时,确认对象依然无法被访问,才回收对象占用的空间。
七 降低GC开销的措施
- 避免使用静态变量,因为静态变量的生命周期与应用程序相同,即使长期不被使用,依然占据内存空间。
- 资源连接,如OutputStream\InputStream\Connection\Socket,使用完毕,应立即关闭,及时释放资源。
- 尽量不要显式调用System.gc(),因为该方法可能触发Full GC,开销较大。
- 减少临时变量的使用,因为方法执行完毕后,临时变量变成垃圾,大量的临时变量会提高gc次数,增加系统消耗。
- 对象引用完毕后,及时释放引用,以便及时回收内存空间。
- 尽量使用可变对象,降低不可变对象的使用次数。
- 尽量使用基本类型变量代替相应的包装类,因为基本类型变量占用的资源比对应的包装类少得多。
- 分散创建与删除对象,因为集中创建对象,需要大量的空间,很可能触发Full GC,瞬间增大系统消耗。集中删除对象,瞬间出现大量无用对象,也有可能触发Full GC。
参考:
https://www.ibm.com/developerworks/cn/java/l-JavaMemoryLeak/
http://www.cnblogs.com/andy-zcx/p/5522836.html
http://www.cnblogs.com/yulinfeng/p/7163052.html
http://www.cnblogs.com/laoyangHJ/archive/2011/08/17/JVM.html
http://blog.csdn.net/hudashi/article/details/52058355
http://blog.csdn.net/lu1005287365/article/details/52475957