JVM必不可少的知识
1.Java垃圾回收机制
对象被判断为垃圾的标准:没有被其他对象引用
2.判断对象是否可被回收
(1)引用计数算法
判断对象的引用数量
- 通过判断对象的引用数量来决定对象是否可以被回收
- 每个对象实例都有一个引用计数器,被引用则+1,完成引用则-1
- 任何引用计数为0的对象实例可以被当作垃圾回收
优点:执行效率高,程序执行受影响较小
缺点:无法检测出循坏引用的情况,导致内存泄露
(2)可达性分析算法(引自离线数学的图论)
通过判断对象的引用链是否可达来决定对象是否可以被回收
可不可达判断:如果从一个对象没有到达根对象的路径,或者说从根对象开始无法引用到该对象,该对象就是不可达的,具体看下图。
什么可以作为GC Root的对象?
- 虚拟机栈中引用的对象(栈帧中的本地变量表)
- 方法区中的常量引用的对象
- 方法区中的类静态属性引用的对象
- 本地方法中JNI(Native方法)的引用对象
- 活跃线程的引用对象
3.垃圾回收算法
(1)标记-清除算法
- 标记:从根集合进行扫描,对存活的对象进行标记(可达性算法)
- 清除:对堆内存从头到尾进行线性遍历,回收不可达对象内存
缺点:碎片化
可以从上图看出,空白的就是被回收的,会产生碎片
(2)复制算法
分为对象面和空闲面
原理:对象在对象面上创建,存活的对象被从对象面复制到空闲面,将对象面所有对象内存清除
解决碎片化问题
顺序分配内存,简单高效
适用于对象存活率低的场景
(3)标记-整理算法
在标记清除算法的基础上,解决了内存碎片化问题
- 标记:从根集合进行扫描,对存活的对象进行标记(可达性算法)
- 清除:移动所有存活的对象,且按照内存地址次序依次排列,然后将末端内存地址以后的内存全部回收
好处:
- 避免内存的不连续行
- 不用设置两块内存互换
- 适用于存活率高的场景
(4)分代收集算法
- 垃圾回收算法的组合拳
- 按照对象生命周期的不同划分区域以采用不同的垃圾回收算法
目的:提高jvm执行效率
jdk6,jdk7
jdk8及其以后的版本,永久代被去掉了
GC的分类
- Minor GC(新生代GC)
- Full GC(老年代GC)
1)年轻代
尽可能快速地收集掉那些生命周期短的对象
- Eden区
- 两个Survivor区
年轻代垃圾回收的过程演示
存活对象被复制到S0,年龄+1,Eden区清空,如下图
如果Eden区又有对象,则把所有东西复制到S1,年龄+1,其他区东西清除,S1变为from区,S0变为to区
对象如何晋升到老年代
- 经历一定Minor次数依然存活的对象
- Survivor区中存放不下的对象
- 新生成的大对象(-XX:+PretenuerSizeThreshold)
常用的调优参数
- -XX:SurvivorRatio:Eden和Survivor的比值,默认8:1
- -XX:NewRatio:老年代和年轻代内存大小的比例
- -XX:MaxTenuringThreshold:对象从年轻代晋升到老生代经过GC次数的最大阈值
2)老年代
存放生命周期较长的对象
常用的算法:
- 标记-清理算法
- 标记-整理算法
触发Full GC的条件
- 老年代空间不足
- 永久代空间不足
- CMS GC时出现promotion failed,concurrent mode failure
- Minor GC晋升到老年代的平均大小大于老年代的剩余空间
- 调用System.gc()
- 使用RMI来进行RPC或管理的JDK应用,每小时执行1次Full GC
4.垃圾收集器
Stop-the-World
- JVM由于要执行GC而停止了应用程序的执行
- 任何一种GC算法中都会发生
- 多数GC优化通过减少Stop-the-World发生的时间来提高程序性能
Safepoint(安全点)
- 分析过程中对象引用关系不会发生变化的点
- 产生Safepoint的地方:方法调用;循环判断;异常跳转等
- 安全点数量得适中
jVM的运行模式
- Server(启动慢,但运行快,采用重量级虚拟机)
- Client(启动快,采用轻量级虚拟机)
垃圾收集器之间的联系
(1)年轻代常见垃圾收集器
1)Serial收集器(-XX:+UseSerialGC,复制算法)
JAVA虚拟机中最基本,历史最悠久的收集器,在jdk1.3.1之前是年轻代收集器的唯一选择。
- 单线程收集,指的是进行垃圾收集时,必须暂停所有工作线程
- 简单高效,Client模式下默认的年轻代收集器
2)ParNew收集器(-XX:+UseParNewGC,复制算法)
- 多线程收集,其余的行为、特点和Serial收集器一样
- 单核执行效率不如Serial,在多核下执行才有优势
3)Parallel Scavenge收集器(-XX:+UseParallelGC,复制算法)
吞吐量=运行用户代码时间/(运行用户代码时间+垃圾收集时间)
- 比起关注用户线程停顿时间,更关注系统的吞吐量(适用在后台运算,不需要太多交互的情况)
- 在多核下执行才有优势,Server模式下默认的年轻代收集器
(2)老年代常见垃圾收集器
1)Serial Old收集器(-XX:+UseSerialOldGC,标记-整理算法)
- 单线程收集,指的是进行垃圾收集时,必须暂停所有工作线程
- 简单高效,Client模式下默认的年轻代收集器
2)Parallel Old收集器(-XX:+UseParallelOldGC,标记-整理算法)
- 多线程,吞吐量优先
3)CMS收集器(-XX:+UseConcMarkSweepGC,标记-清除算法)
- 初始标记:stop-the-world
- 并发标记:并发追溯标记,程序不会停顿
- 预清理:查找执行并发标记阶段从年轻代晋升到老年代的对象
- 重新标记:暂停虚拟机,扫描CMS堆中的剩余对象
- 并发清理:清理垃圾对象,程序不会停顿
- 并发重置:重置CMS收集器的数据结构
4)G1(Garbage First)收集器(-XX:+UseG1GC,复制+标记-整理算法)
- 将整个Java堆内存划分成多个大小相等的Region
- 年轻代和老年代不再物理隔离
特点
- 并发和并行
- 分代收集
- 空间整合
- 可预测的停顿
5.面试题
Object的finalize()方法的作用是否与C++的析构函数作用相同
- 与C++的析构函数不同,析构函数调用确定,而它的是不确定的
- 将未被引用的对象放置于F-Queue队列(当垃圾回收器宣布一个对象死亡,至少需要经过两个阶段,1.当对象进行可达性分析时发现没有和GC ROOTS相连接就会被第一次标记;2.判断对象是否覆盖finalize(),如果覆盖,并且未被引用过这个方法的对象就会被放在F-Queue中,最后由JVM执行该方法)
- 方法执行随时可能会被终(优先级低)
强引用(Strong Reference)
- 最普遍的引用:Object object = new Object()
- 抛出OutOfMemoryError终止程序也不会回收具有强引用的对象
- 通过将对象设置为null来弱化引用,使其被回收
软引用(Soft Reference)
- 对象出在有用但非必须的状态
- 只有当内存空间不足时,GC会回收该引用对象的内存
- 可以用来实现高速缓存
弱引用(weak Reference)
- 非必须的对象,比软引用更弱一些
- GC时会被回收
- 被回收的概率也不大,因为GC线程优先级比较低
- 适用于引用偶尔被使用且不影响垃圾收集的对象
虚引用(PhantomReference)
- 不会决定对象的生命周期
- 任何时候都可能被垃圾收集器回收
- 跟踪对象被垃圾收集器回收的活动,起哨兵作用
- 必须和引用队列ReferenceQueue联合使用
String str = new Sring("abc"); // 强引用 SoftReference<String> sr = new SoftReference<String>(str); // 软引用 WeakReference<String> sr = new WeakReference<String>(str); // 弱引用 ReferenceQueue queue = new ReferenceQueue(); PhantomReference ref = new PhantomReference(str,queue); // 虚引用
四种引用比较
引用级别:强引用>软引用>弱引用>虚引用
类层次结构
引用队列(ReferenceQueue)
- 无实际存储结构,存储逻辑依赖于内部节点之间的关系来表达
- 存储关联的且被GC的软引用,弱引用以及虚引用