alertmanager 设置 repeat_interval 不生效

这个问题其实并不是repeat_interval真的没生效,而是告警没有重复,人家发的是新的告警,没有命中repeat_interval规则。

举个栗子

1
2
3
4
5
6
7
8
- alert: HighCpuLoad
          expr: 100-(avg(irate(node_cpu_seconds_total{mode="idle"}[5m])) by(instance)* 100) > 70
          for: 1m
          labels:
            severity: warning
          annotations:
            summary: "Host high CPU load (instance {{ $labels.instance }})"
            description: "CPU load is > 80% VALUE = {{ $value }} LABELS = {{ $labels }}"

 

它当前值确切到小数点后很多位了,导致每次查出来数字都不一样,所以认为是新的告警。可以把当前值去掉或者只保留整数位再四舍五入一下。

 

posted @   高佳丰  阅读(100)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
点击右上角即可分享
微信分享提示