Prometheus 告警收敛
Prometheus 告警收敛
告警面临最大问题,是警报太多,相当于狼来了的形式。收件人很容易麻木,不再继续理会。关键的告警常常被淹没。在一问题中,alertmanger在一定程度上得到很好解决。
Prometheus成功的把一条告警发给了Altermanager,而Altermanager并不是简简单单的直接发送出去,这样就会导致告警信息过多,重要告警被淹没。所以需要对告警做合理的收敛。
告警收敛手段:
- 分组(group):将类似性质的警报分类为单个通知
- 1、减少报警消息的熟练
- 2、同类告警聚合帮助运维排查问题
- 抑制(Inhibition):当警报发出后,停止重复发送由此警报引发的其他警报
-
配置文件:vim alertmanager.yml # inhibit_rules标记:降低告警收敛,减少报警,发送关键报警 inhibit_rules: # source_match: 匹配当前告警发生后其他告警抑制掉 - source_match: # severity: 指定告警级别 severity: 'critical' # target_match:抑制告警 target_match: # severity: 指定抑制告警级别 severity: 'warning' # equal: 只有包含指定标签才可成立规则 equal: ['alertname', 'dev', 'instance']
- 1、消除荣誉报警
- 静默(Silences):是一种简单的特定时间静音提醒的机制
- 1、解决预期告警
创建静默
- 访问地址:http://www.xiangsikai.com:9093/#/alerts
1、创建静默
2、填入开始结束时间,填写标签名称,保存
3、查看创建静默
分类:
Prometheus
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 零经验选手,Compose 一天开发一款小游戏!
· 一起来玩mcp_server_sqlite,让AI帮你做增删改查!!