alertmanager 设置 repeat_interval 不生效
这个问题其实并不是repeat_interval真的没生效,而是告警没有重复,人家发的是新的告警,没有命中repeat_interval规则。
举个栗子
1 2 3 4 5 6 7 8 | - alert: HighCpuLoad expr : 100-(avg(irate(node_cpu_seconds_total{mode= "idle" }[5m])) by(instance)* 100) > 70 for : 1m labels: severity: warning annotations: summary: "Host high CPU load (instance {{ $labels.instance }})" description: "CPU load is > 80% VALUE = {{ $value }} LABELS = {{ $labels }}" |
它当前值确切到小数点后很多位了,导致每次查出来数字都不一样,所以认为是新的告警。可以把当前值去掉或者只保留整数位再四舍五入一下。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了