摘要: 背景 起因于最近的一项工作:我们会定义一些关键指标来衡量当前系统的健康状态,然后配置对应的报警规则来进行监控报警。但是当前的报警规则会产生大量的误报,需要进行优化。我所负责的是将一些和用户行为指标相关的报警规则拆封从日间和夜间两套规则(因为在夜间用户的使用量减少,报警的阈值是可以调高的)。 这实际上 阅读全文
posted @ 2022-07-31 13:01 Zioyi 阅读(855) 评论(0) 推荐(0) 编辑