记一次Pod内存资源限制导致的Pod重启Back-off restarting failed container
- 故障现象
使用Pod启动一个服务,不发送请求Pod正常,只要一发送请求则Pod报错,并且重启Pod
# Back-off restarting failed container
- 排查过程
查看Pod状态发现Pod因为内存溢出重启了
# kubectl get pod -n cloud-prd binary-classification-master-658749cc9b-mcqt2 -o yaml
发现Pod有资源限制
实际Deployment配置文件没有做资源限制,不清楚为什么启动Pod自动做了资源限制
3. 解决方法
修改deployment配置文件,把资源限制增大
查看监控发现该Pod的资源消耗内存在800M左右,之前默认的400M确实不够用
发现关键字OOMKilled则代表是内存资源限制导致的Pod重启,但是目前不清楚是什么原因导致Pod有资源限制
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 开源Multi-agent AI智能体框架aevatar.ai,欢迎大家贡献代码
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
2023-06-25 Linux操作系统怎么使用Windows下的字体
2019-06-25 Python3之偏函数
2019-06-25 Python3之装饰器