摘要:
参考:https://www.prometheus.wang/exporter/install_blackbox_exporter.html 我们监控主机的资源用量、容器的运行状态、数据库中间件的运行数据。 这些都是支持业务和服务的基础设施,通过白盒能够了解其内部的实际运行状态,通过对监控指标的观察 阅读全文
摘要:
参考:https://www.prometheus.wang/exporter/use-promethues-monitor-mysql.html 监控数据库吞吐量 对于数据库而言,最重要的工作就是实现对数据的增、删、改、查。为了衡量数据库服务器当前的吞吐量变化情况。在MySQL内部通过一个名为Qu 阅读全文
摘要:
参考:https://www.prometheus.wang/exporter/use-prometheus-monitor-container.html CAdvisor是Google开源的一款用于展示和分析容器运行状态的可视化工具。通过在主机上运行CAdvisor用户可以轻松的获取到当前主机上容 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/prometheus-recoding-rules.html 通过PromQL可以实时对Prometheus中采集到的样本数据进行查询,聚合以及其它各种运算操作。而在某些PromQL较为复杂且计算量较大时,直接使用PromQL 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/alert-manager-inhibit.html Alertmanager提供了方式可以帮助用户控制告警通知的行为,包括预先定义的抑制机制和临时定义的静默规则。 抑制机制 Alertmanager的抑制机制可以避免当某种问 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/alert-with-wechat.html Alertmanager已经内置了对企业微信的支持,我们可以通过企业微信来管理报警,更进一步可以通过企业微信和微信的互通来直接将告警消息转发到个人微信上。 prometheus官网 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/alert-with-smtp.html 邮箱应该是目前企业最常用的告警通知方式,Alertmanager内置了对SMTP协议的支持,因此对于企业用户而言,只需要一些基本的配置即可实现通过邮件的通知。 在Alertmanage 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/alert-manager-route.html route的完整定义如下: [ receiver: <string> ] [ group_by: '[' <labelname>, ... ']' ] [ continue: 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/alert-manager-config.html 在Alertmanager配置中一般会包含以下几个主要部分: 全局配置(global):用于定义一些全局的公共参数,如全局的SMTP配置,Slack配置等内容; 模板(tem 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/install-alert-manager.html global: resolve_timeout: 5m route: group_by: ['alertname'] group_wait: 10s group_inter 阅读全文
摘要:
# my global config global: scrape_interval: 15s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_interval: 15s # E 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/prometheus-alert-rule.html 定义告警规则 一条典型的告警规则如下所示: groups: - name: example rules: - alert: HighErrorRate expr: job: 阅读全文
摘要:
参考:https://www.prometheus.wang/alert/prometheus-alert-manager-overview.html Alertmanager除了提供基本的告警通知能力以外,还主要提供了如:分组、抑制以及静默等告警特性: 分组 分组机制可以将详细的告警信息合并成一个 阅读全文
摘要:
转自:https://www.prometheus.wang/promql/prometheus-promql-functions.html irate()这样的函数,可以帮助我们计算监控指标的增长率。除了irate以外,Prometheus还提供了其它大量的内置函数,可以对时序数据进行丰富的处理。 阅读全文
摘要:
转自:https://www.prometheus.wang/promql/prometheus-aggr-ops.html Prometheus还提供了下列内置的聚合操作符,这些操作符作用域瞬时向量。可以将瞬时表达式返回的样本数据进行聚合,形成一个新的时间序列。 sum (求和) min (最小值 阅读全文
摘要:
转自:https://www.prometheus.wang/promql/prometheus-promql-operators-v2.html 使用PromQL除了能够方便的按照查询和过滤时间序列以外,PromQL还支持丰富的操作符,用户可以使用这些操作符对进一步的对事件序列进行二次加工。这些操 阅读全文
摘要:
转自:https://www.prometheus.wang/promql/prometheus-query-language.html Prometheus通过指标名称(metrics name)以及对应的一组标签(labelset)唯一定义一条时间序列。指标名称反映了监控样本的基本标识,而lab 阅读全文
摘要:
转自:https://www.prometheus.wang/promql/prometheus-metrics-types.html 了解了Prometheus的底层数据模型,在Prometheus的存储实现上所有的监控样本都是以time-series的形式保存在Prometheus内存的TSDB 阅读全文
摘要:
转自:https://www.prometheus.wang/promql/what-is-prometheus-metrics-and-labels.html 通过Node Exporter暴露的HTTP服务,Prometheus可以采集到当前主机所有监控指标的样本数据。例如: # HELP no 阅读全文