随笔分类 - 码农的思考
摘要:背景 组内有很多项目都涉及复杂的任务流场景: 集群创建、删除等生命周期管理 k8s 资源申请销毁 .... 这些场景都有几个共同的特点: 流程耗时且步骤复杂,需要几十步操作,其中包含云资源申请、脚本执行、接口调用等,且相互存在依赖关系。 任务量随着业务增长而快速迭代,比如每个集群每天都会自动备份等任
阅读全文
摘要:问题描述 该团队最近一次发布后,pod 一天会重启40次左右,时间间隔固定,代码回退后发现依旧会有重启,跟发布前一样,但是时间间隔较长。 问题分析 出现该问题,说明程序有一定的 BUG,一般来说是内存泄露可能性较多,积累到一定阈值后,便会发生 oom 导致重启。 通过监控发现在有问题的版本中内存确实
阅读全文