Prometheus监控学习笔记之Kubernetes集群--AlertManager监控语句汇总
0x00 概述
随着对容器监控精细化的要求越来越高,对容器的监控已不再满足于Grafana看板这类的视觉图表;
需要从pod, container,服务部署的颗粒度进行监控,并建立起对应的告警规则;
pod的不停crash,无限重启,被驱逐Evicted,状态非running;
服务的Deployment部署不完全,desired和current的数量不一致;
0x01 Awesome-prometheus-alerts for kubernetes
该网站内的众多AlertManger监控语句可以直接套用,监控指标与Prometheus采集的监控指标一致;
Awesome-prometheus-alerts for kubernetes
笔记留用
分类:
Prometheus监控学习笔记
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 基于Microsoft.Extensions.AI核心库实现RAG应用
· Linux系列:如何用heaptrack跟踪.NET程序的非托管内存泄露
· 开发者必知的日志记录最佳实践
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· Manus的开源复刻OpenManus初探
· AI 智能体引爆开源社区「GitHub 热点速览」
· 三行代码完成国际化适配,妙~啊~
· .NET Core 中如何实现缓存的预热?