随笔分类 -  监控告警

摘要:1. _over_time() 下面的函数列表允许传入一个区间向量,它们会聚合每个时间序列的范围,并返回一个瞬时向量 avg_over_time(range-vector) : 区间向量内每个度量指标的平均值。 min_over_time(range-vector) : 区间向量内每个度量指标的最小 阅读全文
posted @ 2024-06-06 10:41 yuhaohao 阅读(121) 评论(0) 推荐(0) 编辑
摘要:简单说明 有些情况下,我们可以进入集群查看某些secret的配置,这里如果想修改secret的配置时,没有secrets的源文件,可以采取如下的方案。 例如我们需要修改alertmanager.yaml的配置: 查看导出配置 $ kubectl get secrets -n monitoring a 阅读全文
posted @ 2024-06-03 15:54 yuhaohao 阅读(42) 评论(0) 推荐(0) 编辑
摘要:背景说明 我们有时候在编写exporter时,其中某个采集的metrics接口获取数据很慢,可能需要达到10~20S,基于此种情况,如果我们按照ServiceMonitor默认的配置进行,这里默认scrapeTimeout为10S,采集时会超时,对应Prometheus的Target会提示,serv 阅读全文
posted @ 2024-05-30 14:52 yuhaohao 阅读(173) 评论(0) 推荐(0) 编辑
摘要:通用模糊匹配 irate(node_network_transmit_bytes_total{device!~"lo|bond[0-9]|cbr[0-9]|veth.*"}[5m]) > 0 kube-prometheus部署配置说明 kind: Prometheus metadata: # spe 阅读全文
posted @ 2024-01-15 16:00 yuhaohao 阅读(25) 评论(0) 推荐(0) 编辑
摘要:一.简单介绍 这里介绍使用prometheus+grafana+node_exporter实现linux系统的监控。下面针对这三个组件进行具体的说明 prometheus prometheus是一套开源的监控与报警与时间序列数据库的组合。 grafana grafana是一个跨平台的开源的度量分析和 阅读全文
posted @ 2020-05-29 20:10 yuhaohao 阅读(2249) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示