摘要:
在Prometheus Server中定义告警规则以及产生告警,Alertmanager组件则用于处理这些由Prometheus产生的告警。Alertmanager即Prometheus体系中告警的统一处理中心。 Prometheus告警简介 告警能力在Prometheus的架构中被划分成两个独立的 阅读全文
摘要:
Prometheus鼓励用户监控所有的东西,首先是及时发现问题其次是要能够快速对问题进行定位。 4个黄金指标 4个黄金指标可以在服务级别帮助衡量终端用户体验、服务中断、业务影响等层面的问题。 主要关注与以下四种类型的指标:延迟,通讯量,错误以及饱和度: 延迟:服务请求所需时间。 记录用户所有请求所需 阅读全文
摘要:
样本 Prometheus会将所有采集到的样本数据以时间序列(time-series)的方式保存在内存数据库中,并且定时保存到硬盘上。 time-series是按照时间戳和值的序列顺序存放的,我们称之为向量(vector). 每条time-series通过指标名称(metrics name)和一组标 阅读全文
摘要:
访问http://localhost:9100/metrics,可以看到当前node exporter获取到的当前主机的所有监控数据,如下所示: 每一个监控指标之前都会有一段类似于如下形式的信息: # HELP node_cpu Seconds the cpus spent in each mode 阅读全文
摘要:
Prometheus Server Prometheus Server是Prometheus组件中的核心部分,负责实现对监控数据的获取,存储以及查询。 Prometheus Server可以通过静态配置管理监控目标,也可以配合使用Service Discovery的方式动态管理监控目标,并从这些监控 阅读全文