Trino Master OOM 排查记录

背景

最近线上的 trino 集群 master 节点老是因为 OOM crash，我们注意到 trino crash 前集群正在运行的查询数量正常，不太像是因为并发查询数据太多导致的 OOM。遂配置 trino master 的 jvm，使其在崩溃后生成一份 dump 文件，方便我们进行问题排查。

排查问题过程

收集到了 Trino master oom dump 文件，用 mat 工具对其分析得出报告。
从报告得知，trino master crash 前有一条查询消耗掉了大量资源，还有一大堆的 DeleteFileIndex 实例也消耗掉很多资源。

我们有收集 trino 上所有的查询语句，通过 query_id 定位到那条异常 SQL。初看 SQL 逻辑，没太大问题，应该不会导致 trino master oom。
于是找一个 trino 集群做故障还原，发现并发执行异常SQL 4条，master 就会 crash。
于是进 trino-master 容器内，用 arthas 实时观察 jvm 状况。
发现当异常SQL 发起查询时，jvm 内 iceberg-work-pool 线程的 cpu 暂用率会飙升到 100%，且此时 jvm 内存也在飙升，过程持续 20s，刚好是异常SQL 生成执行计划所花费的时间。

然后使用 arthas 查看 iceberg-work-pool 线程在干嘛？发现其在调用 DeleteFileIndex 这个类，在报告里面也是属于 top 10 comsumer 。

看栈信息，得到信息在扫描 iceberg 的 manifestlist 时，会去扫描已删除的文件。猜测大概率是需要找到已删除的数据和现在存在的数据做一个 merge，才是当前快照的真实数据。

于是分析怀疑表 nft_orders_v2 的元数据信息，发现 snapshow 里需要读取大量的删除文件。

snapshots

而 Trino 是使用 merge on read 模式进行 merge/update/delete 操作的，这样的话每次查询时，得扫描 "delete file" 来和 "data file" 进行合并，得出真实数据。

所以问题就出现在这，由于该表每半小时生产一次，底层存在大量的 'delete file' ，每次查询时都要扫描这些 'delete file' 然后做 merge 操作生成执行计划。这步操作消耗掉很多 cpu资源和内存资源，导致 trino master 节点崩溃。

解决方案

使用 trino 的小文件合并功能，重写底层数据文件即可修复。

ALTER TABLE nft_orders_v2 EXECUTE optimize (file_size_threshold => '100MB')

为了规避此类问题再次分析，还需要找出哪些查询的查询计划时间大于 10s，找出这些查询并分析用到的表的元数据是否合理，不合理要及时修正。

posted @ 2023-03-13 13:35 meicanhong 阅读(437) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· Iceberg 数据治理及查询加速实践

· Trino 409 Sorted Table 性能测试报告

· 一次线上OOM问题的个人复盘

· 一次线上OOM问题的个人复盘

· 使用JPofiler工具分析OOM原因

阅读排行：
· TypeScript + Deepseek 打造卜卦网站：技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗？
· 【译】Visual Studio 中新的强大生产力特性
· 【设计模式】告别冗长if-else语句：使用策略模式优化代码结构
· 10年+ .NET Coder 心语 ── 封装的思维：从隐藏、稳定开始理解其本质意义

公告

欢迎关注我的Github https://github.com/meicanhong

昵称： meicanhong
园龄： 5年7个月
粉丝： 4
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案 (10)

文章档案 (6)

阅读排行榜

评论排行榜

1. 折腾黑苹果-小新Pro13(2)

推荐排行榜

1. Trino Master OOM 排查记录(2)

最新评论

1. Re:Trino Worker 规避 OOM 思路
@liuzx8888 加我微信 13059277414...
--meicanhong
2. Re:Trino Worker 规避 OOM 思路
博主你好，按照这个文章的思路配置，我搭建的trino的环境还是非常的不稳定，同样的机器用presto跑起来就很稳定，关于trino的内存配置，如果方便的话能否给个联系方式跟你请教一下，万分感谢！！！！...
--liuzx8888
3. Re:折腾黑苹果-小新Pro13
@呀哈哈999 这台电脑我已经出掉了你说的电池问题我也遇到了，我没去解决。 oc 升级我是用 OCAuxiliaryTools 这款工具，Github 有我的 efi 文件，替换 efi 前记得...
--meicanhong
4. Re:折腾黑苹果-小新Pro13
大佬的教程很给力，我用了有一段时间的bigsur了，但是最近电池有点问题，有时候突然从50%一下子掉光弹出关机界面，猜测是哪里弄坏了。然后折腾了两天想升级一下oc，结果左右都不行，照着整个教程搞了一...
--呀哈哈999