摘要:Prometheus 使用一种称为 TSDB(时间序列数据库)的存储引擎来存储时间序列数据。以下是 Prometheus 存储时间序列数据的基本原理: 时间序列结构: Prometheus 中的每个时间序列都由一个唯一的指标名称(metric name)和一组键值对标签(label pairs)组成
阅读全文
摘要:使用 Prometheus 监控 Kubernetes 集群的核心组件涉及几个关键步骤。以下是一个基本的流程: 1. 部署 Prometheus Operator Prometheus Operator 是一个 Kubernetes 自定义资源控制器,用于管理和操作 Prometheus 集群。通过
阅读全文
摘要:在监控系统设计中,Google 的四个黄金指标(Four Golden Signals) 是衡量系统健康状态的关键指标。Prometheus 作为一款强大的监控工具,可以很好地支持这些指标的采集和展示。以下是这四个黄金指标的详细介绍,以及如何在 Prometheus 中实现这些指标的监控。 1. 四
阅读全文
摘要:cAdvisor(容器顾问)是一个用于监控容器(包括Pod)的工具,它可以搜集一台机器上所有运行的容器信息,并提供基础查询界面和HTTP接口,方便其他组件如Prometheus进行数据抓取。cAdvisor可以对节点机器上的容器进行实时监控和性能数据采集,包括容器的CPU使用情况、内存使用情况、网络
阅读全文
摘要:Prometheus是一个开源的监控和告警工具包,其常用的组件主要包括以下几个部分: Prometheus Server 功能:Prometheus Server是Prometheus的核心组件,负责定时从被监控组件(如Kubernetes、Docker、主机等)中拉取(pull)数据,并将其存储在
阅读全文
摘要:Prometheus四种主要的指标类型包括Counter、Gauge、Histogram和Summary,以及相应的PromQL实例如下: Counter(计数器) 作用:只增不减的计数器,常用于记录请求次数、任务完成数、错误发生次数等。重启进程后,计数会被重置。 PromQL实例:假设我们有一个H
阅读全文
摘要:node-exporter常用监控指标 CPU相关指标: node_cpu_seconds_total{mode="idle"}:CPU空闲时间(秒)的总和。这是评估CPU使用率的重要指标之一。 node_cpu_seconds_total{mode="system"}、node_cpu_secon
阅读全文