摘要:
转载自博客: 在我们的 Kuberenetes 集群中,我们偶尔会遇到集群节点内存不足并且 Linux 调用 OOM killer 的情况。查看日志,似乎调度到节点上的 Pod 正在请求比节点可以分配的内存更多的内存。 问题是,当 OOM killer 被调用时,它会打印出进程列表及其内存使用情况。 阅读全文
摘要:
转载自博客:https://blog.csdn.net/qq_43751862/article/details/126410171 kube-state-metrics常见监控指标 pod kube_pod_info # 有关pod的信息。 kube_pod_start_time # pod的uni 阅读全文
摘要:
转载自博客:https://cloud.tencent.com/developer/article/1791727?areaSource=102001.8&traceId=sGzoJqqFMrhSfsuKDFb2f https://cloud.tencent.com/developer/articl 阅读全文
摘要:
转载自博客:https://blog.csdn.net/ygq13572549874/article/details/128836960 pod是业务运行的基础环境,但是在不同阶段,pod会因为某种事件发生状态变更,那么当pod状态异常时,应该如何排查呢?排查思路如下图。 1. 前置条件 pod运行 阅读全文
摘要:
转载自博客: https://blog.csdn.net/weixin_45112997/article/details/126602058 CrashLoopBackOff 是一种 Kubernetes 状态,表示 Pod 中发生的重启循环:Pod 中的容器已启动,但一遍又一遍的崩溃然后又重新启动 阅读全文