文章分类 - 运维狗的碎碎渣 / prometheus监控
摘要:#!/bin/python # coding:utf-8 import json import sys import base64 import requests from flask import Flask,request from sendmsg import dingding,email,m
阅读全文
摘要:groups: - name: 双鱼-帝国 rules: - alert: disk expr: ceil(100 - (node_filesystem_avail_bytes{fstype=~"ext4|xfs",serverip=~"10.254.25.*"} / node_filesystem
阅读全文
摘要:链接:https://blog.csdn.net/sdhzdtwhm/article/details/135546426 1 概述本文用来介绍Grafana常用模板,请点赞并收藏,方便后续使用。 2 模板示例2.1 NodeExporterID:16522 2.2 Blackbox-Exporter
阅读全文
摘要:prometheus.yaml # my global config global: scrape_interval: 30s # Set the scrape interval to every 15 seconds. Default is every 1 minute. evaluation_i
阅读全文
摘要:采集间隔,rule检查间隔,for持续时间,注意三者的关系,如果采集间隔是1分钟,for:2m,那采集的点为1-2,大多是1,所以for需要设置为2-3个采集周期之间才能保证一直是2个点,即150s reload prometheus时会有误告,注意之前是active状态的,重启变为pending,
阅读全文
摘要:使用mongodb_exporter监控mongodb的性能情况 [Unit] Description=MongoDB Exporter [Service] Type=simple User=wbird Restart=never ExecStart=/home/wbird/mongodb_expo
阅读全文
摘要:示例: 查询CPU使用率 curl -G 'http://10.250.100.1:9999/api/v1/query' --data-urlencode 'query=ceil(100 - (avg by(serverip, hostname, env, os, type, department,
阅读全文
摘要:Alertmanager高可用 Alertmanager高可用 日常部署alertmanager组件的时候,都是用的单点架构,架构图如下所示: 那么显然这样是存在单点故障的,另外对运维而言,其实单点故障是很可怕的,收不到报警有时候是致命的,所以要用高可用的报警方式: alertmanager的高可用
阅读全文
摘要:告警恢复的配置如下: receivers: - name: 'webhook' webhook_configs: - url: 'http://127.0.0.1:5000/webhook' send_resolved: true # 这一行就是告警恢复的配置 在发生告警之后,处理完告警,多久能发送
阅读全文
摘要:import requests # 定义 Prometheus API 的地址和查询语句 prometheus_url = 'http://10.250.100.1:9999/api/v1/query' ss='serverip="10.254.100.100"' promql = 'ceil(10
阅读全文
摘要:一、Alertmanager的安装 1 下载 2.安装 3.启动 4.与prometheus整合 修改prometheus.yml配置文件 alerting: alertmanagers: - static_configs: - targets: - 127.0.0.1:9082 # alertma
阅读全文
摘要:链接 https://www.cnblogs.com/fengjian2016/p/16969040.html POD内存使用率 # Pod实际使用内存数 container_memory_rss # 分配给Pod的内存配额 container_spec_memory_limit_bytes # P
阅读全文
摘要:Prometheus启动参数配置及释义 h, --help:显示帮助信息 --version:显示版本信息 --config.file="prometheus.yml":启动时,指定Prometheus读取配置文件的路径。 --web.listen-address="0.0.0.0:9090" :指
阅读全文
摘要:mtail 配置 cat /etc/mtail/error.mtail counter error_log by file,date,info /\[(?P<date>\d{4}-\d{2}-\d{2} \d{2}:\d{2}:\d{2})\]\[error\],(?P<info>.*)/ { er
阅读全文
摘要:grafana是非常流行的可视化工具,在工作中我们经常需要将grafana面板与其它页面进行集成。但是侧边栏就显得有些多余,那如何去掉侧边栏呢? 网上说的最多的方案就是在URL后面加上参数 "&kiosk=tv",可是这样就全部隐藏掉了,无法满足需求。 经过多次尝试,最终发现一种比较好的方法,记录一
阅读全文