垃圾回收算法
什么是垃圾?
垃圾是指在运行程序中没有任何指针指向的对象,这个对象就是垃圾。
如果不及时对内存中的垃圾进行清理,那么,这些垃圾对象所占的内存空间会一直保留到应用程序结束,被保留的空间无法被其他对象使用。甚至导致内存溢出。
标记阶段:对象存活判断
垃圾标记阶段:堆里存放着几乎所有的Java对象实例,在GC执行垃圾回收之前,首先需要区分出内存中哪些是存活对象,哪些是已经死亡的对象。只有被标记已经死亡的对象,GC才会在执行垃圾回收时,释放掉其所占用的内存空间。
判断对象存活一般有两种方式:引用计数算法和可达性分析算法
垃圾标记阶段的算法之引用计数算法(java中并未使用):
概述:对每个对象保存一个整型的应用计数器属性。用于记录对象被引用的情况。
优点:实现简单,垃圾对象便于便识;判定效率高,回收没有延迟性。
缺点:1.他需要单独的字段存储计数器,这样的做法增加了存储空间的开销;2.每次赋值都需要更新计数器,伴随着加法和减法操作,这增加了时间开销。3.引用计数器有一个严重的问题,即无法处理循环引用的情况。这是一条致命缺陷,导致在java的垃圾回收器中没有使用这类算法。
可达性分析算法:
相对比域引用计数算法,他可以有效地解决在引用计数算法中循环引用的问题,防止内存泄漏的发生。
详述:》可达性分析算法是以根对象集合GC ROOT(一组必须活跃的引用)为起始点,按照从上至下的方式搜索被根对象集合多连接的目标对象是否科大。
》使用可达性分析算法后,内存中的存活对象都会被根对象集合直接或间接连接着,搜索所走过的路径称为引用链。
GC ROOTs包括以下几类元素:
虚拟机栈引用的对象
比如:各个线程被调用的方法中使用到的参数、局部变量等。
本地方法栈内引用的对象
方法区中类静态属性引用的对象
方法区中常量引用的对象
比如:字符串常量池里的引用
所有被同步锁synchronized持有的对象
如果只针对Java堆中的某一块区域进行垃圾回收(比如:典型的只针对新生代),必须考虑到内存区域是虚拟机自己的实现细节,更不是孤立封闭的,这个区域的对象完全有可能被其他区域的对象所引用,这时候就需要一并将关联的区域对象也加入GC Roots集合中去考虑,才能保证可达性分析的准确性。
finalize方法的使用?
java允许开发人员提供对象被销毁之前的自定义处理逻辑。
垃圾回收此对象之前,总会先调用这个对象的finalize方法
finalize方法允许在子类中被重写,用于在对象被回收时进行资源释放。通常在这个方法中进行一些资源释放和清理的工作,比如关闭文件、套接字和数据库连接等。
由于finalize方法的存在,一个无法触及的对象有可能在某一个条件下“复活”自己。如果这样,那么对他的回收时不合理的。为此,对象有三种状态。
可触及的:从根节点开始,可以到达这个对象
可复活的:对象的所有引用都被释放,但是对象有可能在finalize中复活(与引用链上的任何一个对象建立联系)
不可触及的:finalize方法调用,还是没有复活。
判定一个对象objectA是否可回收,至少要经历两次标记过程。
1.如果对象A到GC Roots没有引用链,则进行第一次标记。
2.进行筛选,判断此对象是否有必要执行finalize方法。
》如果没有重写finalize方法,就没必要执行。
》如果重写了,对象A会被插到F-Queue队列中,由一个虚拟机自动创建的、低优先级的线程触发finalize方法。
》GC会对F-Queue中的对象进行二次标记。如果对象A在finalize方法中域引用链上的对象建立联系,那么对象A不会被回收。如果没有建立关系,那么就会被回收。
清除阶段:
标记-清除算法:是一种非常基础和常见的垃圾收集算法。
执行过程:
标记:Collector从引用根节点开始遍历,标记所有被引用的对象。一般是在对象的Header中记录为可达对象
清除:Collector对堆内存从头到尾进行线性的遍历,如果发现某个对象在其Header中没有标记为可达对象,则将其回收。
缺点:》效率不算高
》在进行GC的时候,需要停止整个应用程序,导致用户体验差
》这种方式清理出来的空闲内存是不连续的,产生内存碎片。需要维护一个空闲列表。
何为清除?
这里所谓的清除并不是真正的清除,而且将要清除的对象地址保存在一个空闲列表中,下次有对象需要加载时,直接将这个空闲列表的地址进行覆盖。
复制算法:
概念:将活着的内存空间分为两块,每次只使用其中一块,在垃圾回收时将正在使用的内存的存活对象赋值到未使用的内存块中,之后清除正在使用的内存块中的所有对象,交换两个内存的角色,最后完成垃圾回收。
优点:实现简单、运行高效;复制过去以后保证空间的连续性,不会出现“碎片”问题。
缺点:1.需要2倍的内存空间 2.对于G1这种分拆成大量region的GC,复制而不是移动,意味着GC需要维护region之间对象引用关系,不管是内存占用或者时间开销也不小。
特别的,如果系统中存活的对象很多,复制算法的效率就会非常低。所以在新生代中几乎所有的对象都是朝生夕死的,所以在survivor区使用复制算法。而老年代之所以不使用复制算法,恰巧是老年代中的对象几乎不会死。
标记-压缩算法(标记-整理):
执行过程:第一阶段和标记-清除算法一样,从根节点开始标记所有被引用对象。
第二阶段将所有的存活对象压缩到内存的一端,按顺序排放。之后,清理边界外所有的空间。
标记-压缩算法的最终效果等同于标记-清理算法执行完成后,在进行一次内存碎片整理,因此,也可以把它称为标记-清除-压缩算法。
优点:》消除了标记-清除算法当中,内存区域分散的缺点,我们需要给新对象分配内存时,JVM只需要持有一个内存的起始地址即可。
》消除了赋值算法当中,内存减半的高额代价
缺点:》从效率上来说,标记-整理算法要低于复制算法
》移动对象的同时,如果对象被其他对象引用,则还需要调整引用的地址。
》移动过程中,需要全程暂停用户应用程序,即:STW
内存泄漏的例子?
1.单例模式
单例的生命周期和应用周期是一样长的,所以单例程序中,如果持有对外部对象的引用的话,那么这个外部对象是不不能被回收的,则会导致内存泄漏的产生。
2.一些提供close的资源未关闭导致内存泄漏
数据库连接(dataSourse.getConnection()),网络连接(socket)和io连接必须手动close,否则是不能被回收的。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南