随笔分类 - Prometheus
摘要:# Prometheus常用查询 ## 集群指标 ``` promql # CPU核心总数 sum(machine_cpu_cores{cluster="$cluster",job="kubelet"}) by(cluster) # CPU请求总数 sum(kube_pod_container_re
阅读全文
摘要:Alertrules groups: - name: 'node running status' rules: - alert: 'Instance Down' expr: 'up == 0' for: 5s annotations: title: 'Instance Down' descripti
阅读全文
摘要:指标抓取的生命周期 Prometheus 在每个 scrape_interval 期间都会检测执行的 job,这些 job 会根据指定的服务发现配置生成 target 列表; 服务发现会返回一个 target 列表,其中包含一组以 __meta_ 为开头的元数据的标签; 服务发现还会根据目标配置来设
阅读全文
摘要:Prometheus 监控系统 Prometheus简介 Prometheus 是一个开源系统监控和警报工具包,最初构建于 SoundCloud。自 2012 年成立以来,许多公司和组织都采用了 Prometheus,该项目拥有非常活跃的开发者和用户社区。它现在是一个独立的开源项目,独立于任何公司进
阅读全文