摘要:
现象 测试环境中出现了一个异常的告警现象:一条告警通过 Thanos Ruler 的 HTTP 接口观察到持续处于 active 状态,但是从 AlertManager 这边看这条告警为已解决状态。按照 DMP 平台的设计,告警已解决指的是告警上设置的结束时间已经过了当前时间。一条发送至 Alert 阅读全文
摘要:
一、前言 Prometheus 提供了本地存储,本文主要讲述 Prometheus 自带的 tsdb 时序数据库。 二、本地存储(tsdb) 1. 什么是时序数据库 时序数据库全称为时间序列数据库。时间序列数据库主要用于指处理带时间标签(按照时间的顺序变化,即时间序列化)的数据,带时间标签的数据也称 阅读全文
摘要:
Prometheus 数据基本查询 上篇文章【第04期:Prometheus 数据采集(三)】介绍了 Prometheus 数据采集流程,本文开始将介绍 Prometheus 数据查询。本文会介绍数据查询的基本使用。 PromQL 简介 Prometheus 通过指标名称(metrics name) 阅读全文
摘要:
Prometheus 的监控对象各式各样,没有统一标准。为了解决这个问题,Prometheus 制定了一套监控规范,符合这个规范的样本数据可以被 Prometheus 采集并解析样本数据。Exporter 在 Prometheus 监控系统中是一个采集监控数据并通过 Prometheus 监控规范对 阅读全文
摘要:
Prometheus 数据采集过程介绍 Prometheus 从采集数据到将存储的过程中,会对采集目标及数据样本作一系列处理。了解这个过程有利于帮助我们更充分、合理的使用可配参数。 一、文章中使用的概念简介 target:采集目标,Prometheus Server 会从这些目标设备上采集监控数据 阅读全文
摘要:
一、采集数据格式及分类 1.1 采集数据的格式x` Prometheus 使用 metric 表示监控度量指标,它由 metric name (度量指标名称)和 labels (标签对)组成: <metric name>{<label name=<label value>, ...} metric 阅读全文
摘要:
一、产品简介 Prometheus 最开始是由 SoundCloud 开发的开源监控告警系统,是 Google BorgMon 监控系统的开源版本。 在 2016 年,Prometheus 加入 CNCF,成为继 Kubernetes 之后第二个被 CNCF 托管的项目。随着 Kubernetes 阅读全文