「Bug」Linux 负载过高(K8s 节点)

Bug 描述

K8s Worker 节点负载突然升高至 90+,导致节点 NotReady.
该节点为 8c/10G 的配置,这个负载显然不正常。

排查

首先用 htop,发现 cpu/memory 使用率都不高,怀疑是磁盘 IO 问题。

查看 prometheus 监控:

发现是首先内存飙升致 100%,然后磁盘 IO 升高。

排查节点上的所有 Pod,发现新加了一个 Prometheus 容器,最后确定是另一个监控工具自动部署的。

posted @ 2020-04-06 22:41  於清樂  阅读(1059)  评论(0编辑  收藏  举报