Prometheus监控k8s集群节点主机内存/CPU使用率
CPU使用率:
(1 - avg(rate(node_cpu_seconds_total{mode="idle"}[5m])) by (instance)) *100
说明:
container_cpu_usage_seconds_total 该容器服务针对每个CPU累计消耗的CPU时间。如果有多个CPU,则总的CPU时间需要把各个CPU耗费的时间相加,可以求出平均1s容器使用的时间
machine_cpu_cores cadvisor的当前节点CPU数目
内存使用率:
表达式1:(1 - (node_memory_MemAvailable_bytes{} / (node_memory_MemTotal_bytes{})))* 100
表达式2:(node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes) / node_memory_MemTotal_bytes * 100
说明:
container_memory_working_set_bytes 容器使用内存 更能体现出mem usage,也是oom killer指标
machine_memory_bytes 当前主机内存大小