文章分类 -  运维狗的碎碎渣 / prometheus监控

摘要:#!/bin/python # coding:utf-8 import json import sys import base64 import requests from flask import Flask,request from sendmsg import dingding,email,m 阅读全文
posted @ 2025-02-10 16:12 羊脂玉净瓶 阅读(4) 评论(0) 推荐(0) 编辑
摘要:groups: - name: 双鱼-帝国 rules: - alert: disk expr: ceil(100 - (node_filesystem_avail_bytes{fstype=~"ext4|xfs",serverip=~"10.254.25.*"} / node_filesystem 阅读全文
posted @ 2025-02-10 16:10 羊脂玉净瓶 阅读(4) 评论(0) 推荐(0) 编辑
摘要:链接:https://blog.csdn.net/sdhzdtwhm/article/details/135546426 1 概述本文用来介绍Grafana常用模板,请点赞并收藏,方便后续使用。 2 模板示例2.1 NodeExporterID:16522 2.2 Blackbox-Exporter 阅读全文
posted @ 2024-12-04 14:46 羊脂玉净瓶 阅读(28) 评论(0) 推荐(0) 编辑
摘要:prometheus.yaml # my global config global: scrape_interval: 30s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_i 阅读全文
posted @ 2024-10-29 14:29 羊脂玉净瓶 阅读(7) 评论(0) 推荐(0) 编辑
摘要:采集间隔,rule检查间隔,for持续时间,注意三者的关系,如果采集间隔是1分钟,for:2m,那采集的点为1-2,大多是1,所以for需要设置为2-3个采集周期之间才能保证一直是2个点,即150s reload prometheus时会有误告,注意之前是active状态的,重启变为pending, 阅读全文
posted @ 2024-10-29 14:26 羊脂玉净瓶 阅读(11) 评论(0) 推荐(0) 编辑
摘要:使用mongodb_exporter监控mongodb的性能情况 [Unit] Description=MongoDB Exporter [Service] Type=simple User=wbird Restart=never ExecStart=/home/wbird/mongodb_expo 阅读全文
posted @ 2024-09-02 14:10 羊脂玉净瓶 阅读(3) 评论(0) 推荐(0) 编辑
摘要:示例: 查询CPU使用率 curl -G 'http://10.250.100.1:9999/api/v1/query' --data-urlencode 'query=ceil(100 - (avg by(serverip, hostname, env, os, type, department, 阅读全文
posted @ 2023-11-24 14:50 羊脂玉净瓶 阅读(491) 评论(0) 推荐(0) 编辑
摘要:Alertmanager高可用 Alertmanager高可用 日常部署alertmanager组件的时候,都是用的单点架构,架构图如下所示: 那么显然这样是存在单点故障的,另外对运维而言,其实单点故障是很可怕的,收不到报警有时候是致命的,所以要用高可用的报警方式: alertmanager的高可用 阅读全文
posted @ 2023-08-04 16:47 羊脂玉净瓶 阅读(116) 评论(0) 推荐(0) 编辑
摘要:告警恢复的配置如下: receivers: - name: 'webhook' webhook_configs: - url: 'http://127.0.0.1:5000/webhook' send_resolved: true # 这一行就是告警恢复的配置 在发生告警之后,处理完告警,多久能发送 阅读全文
posted @ 2023-08-01 09:49 羊脂玉净瓶 阅读(564) 评论(0) 推荐(0) 编辑
摘要:import requests # 定义 Prometheus API 的地址和查询语句 prometheus_url = 'http://10.250.100.1:9999/api/v1/query' ss='serverip="10.254.100.100"' promql = 'ceil(10 阅读全文
posted @ 2023-07-25 16:56 羊脂玉净瓶 阅读(59) 评论(0) 推荐(0) 编辑
摘要:一、Alertmanager的安装 1 下载 2.安装 3.启动 4.与prometheus整合 修改prometheus.yml配置文件 alerting: alertmanagers: - static_configs: - targets: - 127.0.0.1:9082 # alertma 阅读全文
posted @ 2023-04-18 16:33 羊脂玉净瓶 阅读(215) 评论(0) 推荐(0) 编辑
摘要:链接 https://www.cnblogs.com/fengjian2016/p/16969040.html POD内存使用率 # Pod实际使用内存数 container_memory_rss # 分配给Pod的内存配额 container_spec_memory_limit_bytes # P 阅读全文
posted @ 2023-02-10 14:18 羊脂玉净瓶 阅读(798) 评论(0) 推荐(0) 编辑
摘要:Prometheus启动参数配置及释义 h, --help:显示帮助信息 --version:显示版本信息 --config.file="prometheus.yml":启动时,指定Prometheus读取配置文件的路径。 --web.listen-address="0.0.0.0:9090" :指 阅读全文
posted @ 2022-12-27 14:02 羊脂玉净瓶 阅读(3066) 评论(0) 推荐(0) 编辑
摘要:mtail 配置 cat /etc/mtail/error.mtail counter error_log by file,date,info /\[(?P<date>\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2})\]\[error\],(?P<info>.*)/ { er 阅读全文
posted @ 2022-11-11 15:28 羊脂玉净瓶 阅读(491) 评论(0) 推荐(0) 编辑
摘要:grafana是非常流行的可视化工具,在工作中我们经常需要将grafana面板与其它页面进行集成。但是侧边栏就显得有些多余,那如何去掉侧边栏呢? 网上说的最多的方案就是在URL后面加上参数 "&kiosk=tv",可是这样就全部隐藏掉了,无法满足需求。 经过多次尝试,最终发现一种比较好的方法,记录一 阅读全文
posted @ 2022-11-10 11:54 羊脂玉净瓶 阅读(2106) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示