Prometheus监控K8S各项指标
一、Node监控
1、内存指标
# Node总内存大小: node_memory_MemTotal_bytes{instance="ec2-13-213-40-179.ap-southeast-1.compute.amazonaws.com:9100", job="node"} # Node剩余可用内存: node_memory_MemAvailable_bytes{instance="ec2-13-213-40-179.ap-southeast-1.compute.amazonaws.com:9100", job="node"}
node已用的内存大小计算公式:
node_memory_MemTotal_bytes - node_memory_MemAvailable_bytes
2、CPU
node_load1:CPU1分钟负载
node_load5:CPU5分钟负载
node_load15:CPU15分钟负载
CPU使用率计算公式:
1-avg(irate(node_cpu_seconds_total{mode="idle"}[30m])) by (instance)
3、分区使用
# 各个分区总空间
nodenode_filesystem_size_bytes
# 各分区剩余空间
node_filesystem_avail_bytes
4、磁盘I/O
# 磁盘I/O操作耗费时间 node_disk_io_time_seconds_total # 每秒磁盘读取速度: irate(node_disk_writes_completed_total[30m]) # 每秒磁盘写入速度: irate(node_disk_written_bytes_total[30m]) # 每秒磁盘I/O操作耗费时间计算公式: irate(node_disk_io_time_seconds_total[30m]) # 每次I/O读取耗时计算公式: irate(node_disk_read_time_seconds_total[30m]) / irate(node_disk_reads_completed_total[30m]) # 每次I/O写入耗时计算公式: irate(node_disk_write_time_seconds_total[30m]) / irate(node_disk_writes_completed_total[30m])
5、网络流量
# 网络流量下载统计计算公式: irate(node_network_receive_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'}[30m])*8 # 网络流量上传统计计算公式: irate(node_network_transmit_bytes_total{device!~'tap.*|veth.*|br.*|docker.*|virbr*|lo*'}[30m])*8
二、pod监控
1、POD内存使用率
# Pod实际使用内存数(下面显示了好多哦) container_memory_rss # 分配给Pod的内存配额(下面显示了好多哦) container_spec_memory_limit_bytes # POD内存使用率(下面显示了好多哦) sum(container_memory_rss{container!="POD",container!="alermanager",image!="",pod!=""})by(pod) / sum(container_spec
2、POD的CPU使用率
# container累计使用的CPU时间,除以CPU的总时间,就得到了容器的CPU使用率 container_cpu_usage_seconds_total # container的配额,为容器指定的CPU个数*100000 container_spec_cpu_quota # POD的CPU使用率(空的,没有显示数据) sum(rate(container_cpu_usage_seconds_total{image!="",container!="POD",container!=""}[1m])) by (pod,namespace) / (sum(container_spec_cpu_quota{image!="",container!="POD",container!=""}/100000) by (pod,namespace)) * 100
3、POD的文件系统使用量
# POD的文件系统使用量(空的,没有显示数据) sum(container_fs_usage_bytes{image!="",container!="POD",container!=""}) by(pod, namespace) / 1024 / 1024 / 1024
-----------------------------------
©著作权归作者所有:来自51CTO博客作者清风明月li的原创作品,请联系作者获取转载授权,否则将追究法律责任
Prometheus监控K8S各项指标
https://blog.51cto.com/liqingbiao/5254266