grafana配置多主机webhook告警
grafana多主机监控告警配置
-
环境
- grafana:Version 7.3.1
- data source:clickhouse 20.4.5.36
- plugins:Vertamedia-clickhouse-grafana
-
创建告警渠道(使用webhook短信告警)
选择Alerting-->Notification channels
选择New channel
填写详细信息,报警类型选择webhook
根据需求进行配置,配置完成后点击
Test
进行测试测试成功时提示如下:
同时在调用的告警接口中能够正常接收测试告警信息:
-
为Graph panel添加告警规则
例:创建cpu资源监控,sql如下
SELECT $timeSeries as t, avg(100-value), ip FROM monitor.metrics WHERE $timeFilter AND name = 'cpu_usage_idle' GROUP BY t,ip ORDER BY t #库名和表名不能使用变量否则无法获取告警的具体信息
告警配置如下:
name #告警名称 Evaluate every #检测的频率 For #pending状态持续时间 Conditions #报警触发条件,支持多条件and,or逻辑运算 max ()#取值运算 query (A, 5m, now) #从当前时间取前五分钟查询A的值 IS ABOVE 2 #运算的结果高于2 If no data or all values are null #当没有数据或为空时设置状态为 If execution error or timeout #超时或其他错误时设置状态为 Send to #所使用的报警渠道(渠道配置为default是默认选择) Message #报警信息
-
告警测试
点击
Test rule
进行测试保存配置
查看报警API数据,能够获取到所有触发告警条件的主机ip信息
-
添加多个告警配置