Fork me on GitHub

合集-TiDB Troubleshooting

摘要:背景 前段时间用户反馈某生产环境 TiDB 集群 drainer 频繁发生故障,要么服务崩溃无法启动,要么数据跑着跑着就丢失了,很是折磨人。该集群跑的是离线分析业务,数据量20T ,v4版本,有多个 drainer 往下游同步数据,目标端包括kafka、file、tidb多种形态。 两天前刚恢复过一 阅读全文
posted @ 2023-11-16 16:44 balahoho 阅读(279) 评论(0) 推荐(2) 编辑
摘要:背景 前不久从项目一线同学得到某集群的告警信息,某个时间段 TiDB duration 突然异常升高,持续时间6小时左右,需要定位到具体原因。 分析过程 第一招,初步判断 由于项目条件苛刻,历经苦难才拿到监控,在此之前只能靠现场同学的口述排查,oncall人太难了。。 既然是duration升高,那 阅读全文
posted @ 2022-12-20 17:58 balahoho 阅读(1400) 评论(2) 推荐(2) 编辑

返回顶部
点击右上角即可分享
微信分享提示