摘要: 应用类相关 1.监控应用是否可用 规则模板 : up=${value} 规则描述: 监测应用是否可用 参数说明: value : 0表示宕机 1 表示可用 具体应用 groups: - name: example #报警规则组的名字 rules: - alert: InstanceDown #检测j 阅读全文
posted @ 2020-09-08 16:42 paul_hch 阅读(2867) 评论(0) 推荐(0) 编辑
摘要: 告警规则 global: scrape_interval: 15s evaluation_interval: 15s #每过15秒执行一次报警规则,也就是说15秒执行一次报警 alerting: alertmanagers: - static_configs: - targets: ["localh 阅读全文
posted @ 2020-09-08 16:41 paul_hch 阅读(484) 评论(0) 推荐(0) 编辑
摘要: 告警规则的设置是通过yml文件来设置,因此需要遵从yml的语法 groups: - name: example #报警规则组的名字 rules: - alert: InstanceDown #检测job的状态,持续1分钟metrices不能访问会发给altermanager进行报警 expr: up 阅读全文
posted @ 2020-09-08 16:32 paul_hch 阅读(1022) 评论(0) 推荐(0) 编辑