摘要: 概述实现Prometheus的告警,需Altermanager这个组件。Alertmanager与Prometheus是相互分离的两个组件。所以,Alertmanager需单独安装配置。通过在Prometheus中定义AlertRule(告警规则),Prometheus会周期性的对告警规则进行计算, 阅读全文
posted @ 2023-05-24 17:30 技术颜良 阅读(418) 评论(0) 推荐(0) 编辑
摘要: https://blog.csdn.net/weixin_43606975/article/details/125425543 示例: global: resolve_timeout: 5mroute: receiver: webhook group_wait: 30s group_interval 阅读全文
posted @ 2023-05-24 17:00 技术颜良 阅读(528) 评论(0) 推荐(0) 编辑
摘要: 在 Kubernetes 的实际使用过程中,我们经常会碰到一些业务上的异常问题,一般情况下通过日志监控和链路追踪足以能够对问题做出排查与诊断了。但是,在某些场景下,只靠这些手段往往是不够的,一些和网络相关的问题有时候非常棘手。 奇妙的Linux世界 Linux 爱好者聚集地,各种硬核干货文章和新奇内 阅读全文
posted @ 2023-05-24 13:39 技术颜良 阅读(85) 评论(0) 推荐(0) 编辑