grafana配置多主机webhook告警

grafana多主机监控告警配置

  • 环境

    • grafana:Version 7.3.1
    • data source:clickhouse 20.4.5.36
    • plugins:Vertamedia-clickhouse-grafana
  • 创建告警渠道(使用webhook短信告警)

    选择Alerting-->Notification channels

    image-20201120091102352

    选择New channel

    image-20201120091230105

    填写详细信息,报警类型选择webhook

    image-20201120091739818

    根据需求进行配置,配置完成后点击Test进行测试

    image-20201120091829955

    测试成功时提示如下:

    image-20201120092118188

    同时在调用的告警接口中能够正常接收测试告警信息:

    image-20201120092558524

  • 为Graph panel添加告警规则

    例:创建cpu资源监控,sql如下

    SELECT
        $timeSeries as t,
        avg(100-value),
        ip  
    FROM monitor.metrics  
    WHERE
        $timeFilter
        AND name = 'cpu_usage_idle'
    GROUP BY t,ip
    ORDER BY t
    #库名和表名不能使用变量否则无法获取告警的具体信息
    

    告警配置如下:

    image-20201120094205505

    image-20201120094221235

    name #告警名称
    Evaluate every #检测的频率
    For #pending状态持续时间 
    Conditions #报警触发条件,支持多条件and,or逻辑运算
      max ()#取值运算
      query (A, 5m, now)  #从当前时间取前五分钟查询A的值
      IS ABOVE 2 #运算的结果高于2
    If no data or all values are null #当没有数据或为空时设置状态为
    If execution error or timeout #超时或其他错误时设置状态为
    Send to #所使用的报警渠道(渠道配置为default是默认选择)
    Message #报警信息
    
  • 告警测试

    点击Test rule进行测试

    image-20201120103145310

    保存配置

    image-20201120103239165

    查看报警API数据,能够获取到所有触发告警条件的主机ip信息

    image-20201120103317085

  • 添加多个告警配置

    image-20201120103615791

posted @ 2020-11-20 10:46  MirL  阅读(3232)  评论(0编辑  收藏  举报