Alertmanager对接Prometheus实战

启动3种方式
配置文件
启动成功效果

启动3种方式

二进制-Alertmanager官网下载

https://prometheus.io/download/#alertmanager

//下载：
wget https://github.com/prometheus/alertmanager/releases/download/v0.24.0/alertmanager-0.24.0.linux-amd64.tar.gz
//解压：
tar -xf alertmanager-0.24.0.linux-amd64.tar.gz -C /usr/local/
//改名：
mv alertmanager-0.24.0.linux-amd64 alertmanager
//启动
nohup ./alertmanager &
//配置文件
vi alertmanager.yml
//检查配置
./amtool check-config alertmanager.yml

docker-启动

docker run --name alertmanager -d -p 9093:9093 -v /usr/local/alertmanager/alertmanager.yml:/etc/alertmanager/alertmanager.yml prom/alertmanager:v0.24.0

docker-compose-启动

docker-compose up -d

version: '3'
services:
  app:
    container_name: alertmanager
    image: prom/alertmanager:v0.24.0
    ports:
     - "9093:9093"
    restart: unless-stopped
    volumes:
      - ./alertmanager.yml:/etc/alertmanager/alertmanager.yml

启动成功效果

访问：http://192.168.0.52:9093

配置文件

alertmanager.yml

注意：发送的邮箱需要开启smtp服务

alertmanager.yml

global:
  resolve_timeout: 5m
  smtp_smarthost: 'smtp.163.com:465'
  smtp_from: 'test1009122179@163.com'
  smtp_auth_username: 'test1009122179@163.com'
  smtp_auth_password: 'XXXXXX'
  smtp_require_tls: false #关闭tls

route:
  group_by: ['alertname'] #告警分组
  group_wait: 10s #告警等待时间，10秒内出现相同报警，在一个组内出现
  group_interval: 30m #告警间隔，如果组内内容不变化，合并为一条警报信息，1 分钟后发送
  repeat_interval: 8h #重复的告警间隔
  receiver: 'email' #优先使用 email 发送

receivers:
  - name: 'email'
    email_configs:
      - to: 'guyouyin@163.com' #邮件接受者，逗号隔开

inhibit_rules:
  - source_match:
      severity: 'critical'
    target_match:
      severity: 'warning'
    equal: ['alertname', 'dev', 'instance']

prometheus.yml

在prometheus.yml配置文件中开启alertmanager报警9093端口，及加载报警规则文件

prometheus重启

prometheus.yml

alerting:
  alertmanagers:
    - static_configs:
        - targets:
           - 192.168.0.52:9093

# Load rules once and periodically evaluate them according to the global 'evaluation_interval'.
rule_files:
 - "rules/*_rules.yml"
 - "rules/*_alerts.yml"

rules/node_rules.yml--报警规则配置文件

node_rules.yml

groups:
  - name: node_rules
    #interval: 15s
    rules:
      # cpu
      - record: instance:cpu_used
        expr: 100 - avg(irate(node_cpu_seconds_total{mode="idle"}[1m])) by (nodename) * 100
        labels:
          metric_type: CPU_monitor
			# 内存
      - record: instance:memory_used
        expr: 100 - (node_memory_MemAvailable_bytes)/(node_memory_MemTotal_bytes) * 100
        labels:
          metric_type: Memory_monitor
			# 磁盘
      - record: instance:partition_used
        expr: max((node_filesystem_size_bytes{}-node_filesystem_free_bytes{}) *100/(node_filesystem_avail_bytes {}+(node_filesystem_size_bytes{}-node_filesystem_free_bytes{})))by(instance)
        labels:
          metric_type: Partition_monitor

rules/node_alerts.yml--报警规则配置文件

node_alerts.yml

groups:
 - name: node_alerts
   rules:
   - alert: cpu_used
     expr: instance:cpu_used > 60
     for: 1m
     labels:
       severity: warning
     annotations:
       summary: 主机 {{ $labels.nodename }} 的 CPU使用率持续1分钟超出阈值,当前为 {{humanize $value}} %

   - alert: memory_used
     expr: instance:memory_used > 80
     for: 1m
     annotations:
       summary: 主机 {{ $labels.nodename }} 的 内存 使用率持续1分钟超出阈值,当前为 {{humanize $value}} %

   - alert: partition_used
     expr: instance:partition_used > 90
     for: 1m
     annotations:
       summary: 主机 {{ $labels.nodename }} 的 磁盘使用率已达到{{humanize $value}}%,即将超出当前可用空间，请及时扩容!

prometheus-docker-compose.yml

version: '3'
services:
  app:
    container_name: prometheus
    image: prom/prometheus:v2.36.2
    ports:
     - "9090:9090"
    restart: unless-stopped
    volumes:
      # - /etc/localtime:/etc/localtime:ro
      - ./prometheus.yml:/etc/prometheus/prometheus.yml
      - ./data:/prometheus
      - ./rules:/etc/prometheus/rules

启动成功效果

访问：http://192.168.0.52:9090/alerts

收到报警

posted @ Jeff的技术栈阅读 (9999+) 评论 (99) 点赞(99) 编辑 MD 收藏

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· Prometheus监控实战应用

· docker安装prometheus/grafana

· Alertmanager报警模块集成钉钉/企业微信机器人

· AlertManager

· prometheus告警alertmanager邮件告警

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· AI与.NET技术实操系列（二）：开始使用ML.NET
· 单线程的Redis速度为什么快？

公告

好好学习，天天向上！🐱🐱🐱🐱

昵称： Jeff的技术栈
园龄： 5年1个月
粉丝： 1732
关注： 7

+加关注

2025年3月

日

一

二

三

四

五

六

随笔分类

Jeff的技术栈(22)

Jeff的技术栈

生命在于运动，学习在于坚持！！！

Alertmanager对接Prometheus实战

启动3种方式

二进制-Alertmanager官网下载

docker-启动

docker-compose-启动

启动成功效果

配置文件

alertmanager.yml

prometheus.yml

rules/node_rules.yml--报警规则配置文件

rules/node_alerts.yml--报警规则配置文件

prometheus-docker-compose.yml

启动成功效果

公告

搜索

积分与排名

随笔分类