02 2023 档案
Pod-OOM故障监控
摘要:前言 K8s集群和Node宿主机之间的监控覆盖默认是断层的; 需要借助OpenTelemetry实现IasS层(主机)+PasS(K8s)+SasS(微服务层) 日志和监控数据,实现可观测性; 可观测平台可以实现故障的快速定位; 故障分析 Pod因内存不足OOM,一般由以下2种原因导致 原因1:Ku
阅读全文