Go 垃圾回收、三色标记原理
垃圾回收(Garbage Collection,简称 GC)是编程语言中自动的内存管理机制,垃圾回收,垃圾指的是不再需要的内存块,如果不及时清理就没有办法再利用。
垃圾回收算法
常见的垃圾回收算法有:
-
引用计数:每个对象维护一个引用计数,如果这个对象被销毁,则计数 -1 ,当计数为 0 时,回收该对象。
优点:对象可以很快被回收,不会出现内存耗尽或到达阀值才回收。
缺点:不能很好的处理循环引用
-
标记-清除:从根变量开始遍历所有引用的对象,引用的对象标记“被引用”,没有被标记的则进行回收。
优点:解决了引用计数的缺点。
缺点:需要 STW(stop the world),暂时停止程序运行。
-
分代收集:按照对象生命周期长短划分不同的代空间,生命周期长的放入老年代,短的放入新生代,不同代有不同的回收算法和回收频率。
优点:回收性能好
缺点:算法复杂
Go 语言的 GC(垃圾回收)
标记-清除(mark and sweep)
此算法是在 Go V1.3 之前使用的,主要有两个主要的步骤:
标记(Mark phase)——》清除(Sweep phase)
-
暂停程序业务逻辑, 找出不可达的对象,然后做上标记。
注意:mark and sweep 算法在执行的时候,需要程序暂停!也就是所谓的 STW(stop the world)。这段时间程序会卡住。

程序可达对象为 1、2、4
-
开始标记,找出所有可达的对象,并标记

对象 1、2、4 做上标记
-
清除未被标记的对象

-
程序暂停取消。然后重复上面的过程,直至程序生命周期结束。
三色并发标记法
此算法是在 Go V1.5 开始使用的,三色只是为了叙述上方便抽象出来的一种说法,实际上对象并没有颜色之分。这里的三色,对应了垃圾回收过程中对象的三种状态:
-
灰色:对象还在标记队列中等待
-
黑色:对象已被标记,该对象不会在本次 GC 中被清理
-
白色:对象未被标记,该对象将会在本次 GC 中被清理
-
初始状态下所有对象都是白色的。
-
从根节点开始遍历所有对象,把遍历到的对象变成灰色对象(备注:这里变成灰色对象的都是根节点的对象)。
-
遍历灰色对象,将灰色对象引用的对象(备注:这里指的是灰色对象引用到的所有对象,包括灰色节点间接引用的那些对象)也变成灰色对象,然后将遍历过的灰色对象变成黑色对象。
-
循环步骤 3,直到灰色对象全部变黑色。
-
通过写屏障(write-barrier)检测对象有变化,重复以上操作(备注:因为 mark 和用户程序是并行的,所以在上一步执行的时候可能会有新的对象分配,写屏障是为了解决这个问题引入的)。
-
收集所有白色对象(垃圾)。
举例说明:
-
初识阶段,所以对象均为白色,调用情况为:
root ->A->B/A->C/A<->D;root->F;E;G->H;

-
GC 开始扫描,从根节点开始遍历,发现只有 A 和 F 是根节点,于是将 A、F 从变为灰色对象。

-
-
GC 继续扫描灰色对象,会将灰色对象的节点中引用的节点也变为灰色对象,A 节点引用的节点 B、C、D 会被变为灰色对象,接着 A 的所有子节点遍历完毕,便会变为黑色对象,而 F 节点没有子节点,也会变为黑色对象。

-
GC 会循环遍历灰色对象,直到灰色对象之中没有节点为止,在本例中,发现 B、C、D 都没有子节点是白色,便将 B、C、D 都变为黑色对象。

-
剩下 E、G、H 为白色对象,GC 便进行回收这些白色对象。

-
上面的垃圾回收结束之后,GC 会在进行一步操作,也就是将黑色对象重新变色成白色对象,供下一次垃圾回收使用。

Stop The World
Golang 中的 STW(Stop The World)是停掉所有的 goroutine,专心做垃圾回收,待垃圾回收结束后再恢复 goroutine。STW 时间的长短直接影响了应用的执行,时间过长对于一些 web 应用来说是不可接受的,这也是广受诟病的原因之一。为了缩短 STW 的时间,Golang 不断优化垃圾回收算法,这种情况得到了很大的改善。
垃圾回收优化
写屏障(Write Barrier)
STW 目的是防止 GC 扫描时内存变化而停掉 goroutine,而写屏障就是让 goroutine 与 GC 同时运行的手段。虽然写屏障不能完全消除 STW,但是可以大大减少 STW 的时间。写屏障类似一种开关,在 GC 的特定时机开启,开启后指针传递时会把指针标记,即本轮不回收,下次 GC 时再确定。GC 过程中新分配的内存会被立即标记,用的并不是写屏障技术,也即 GC 过程中分配的内存不会在本轮 GC 中回收。
辅助 GC(Mutator Assist)
为了防止内存分配过快,在 GC 执行过程中,如果 goroutine 需要分配内存,那么这个 goroutine 会参与一部分 GC 的工作,即帮助 GC 做一部分工作,这个机制叫作 Mutator Assist。
垃圾回收触发时机
-
每次内存分配时都会检查当前内存分配量是否已达到阀值,如果达到阀值则立即启动 GC。内存增长率由环境变量 GOGC 控制,默认为 100,即每当内存扩大一倍时启动 GC。
阀值 = 上次GC内存分配量 * 内存增长率
-
默认情况下,最长 2 分钟触发一次 GC。
-
程序代码中也可以使用 runtime.GC() 来手动触发 GC。这主要用于 GC 性能测试和统计。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)