随笔分类 - 监控
1
摘要:Thanos[1] 和 VictoriaMetrics[2] 都是用来作为 Prometheus 长期存储的成熟方案,其中 VictoriaMetrics 也开源了其集群版本[3],功能更加强大。这两种解决方案都提供了以下功能: 长期存储,可以保留任意时间的监控数据。 对多个 Prometheus
阅读全文
摘要:容器-promQL语法之内存指标 在容器内进行内存监控的常用指标包括 1、 内存中的cache用量 container_memory_cache 2、 常驻的内存用量 container_memory_rss 3、 交换分区用量 container_memory_swap 4、 内存的总占用量 co
阅读全文
摘要:简介 VictoriaMetrics集群方案,除了有单节点方案的优点以外,还可以做到水平扩容,当有大量数据存储时,VictoriaMetrics集群方案是个不错的选择。 官方建议是100w/s以下的数据点抓取,使用单节点版,单节点版可以省更多的CPU、内存、磁盘资源。 但是,当遇到如下问题可以考虑集
阅读全文
摘要:夜莺v5 报警python脚本 #!/usr/bin/python # -*- coding: UTF-8 -*- # # n9e-server把告警事件通过stdin的方式传入notify.py,notify.py从事件中解析出接收人信息、拼出通知内容,发送通知 # 脚本的灵活性高,要接入短信、电
阅读全文
摘要:n9e 监控系统 需要连接 job ams transfer ,在不同的IDC机房 可以采用 rinetd 或者 rein 转发端口 我没测试过。。。。。。。
阅读全文
摘要:夜莺 上传 数据 curl --location --request POST 'http://192.168.10.121:82/api/transfer/data' \ --header 'Content-Type: application/json' \ --data '[ { "end":
阅读全文
摘要:skywalking cluster: selector: ${SW_CLUSTER:standalone} standalone: # Please check your ZooKeeper is 3.5+, However, it is also compatible with ZooKeepe
阅读全文
摘要:夜莺监控+prometheus
阅读全文
摘要:skywalking 是一个可观测分析平台(OAP) 和 应用性能管理系统(APM) 提供分布式链路追踪, 服务网格 遥测分析, 度量(metric) 聚合和可视化一体化解决方案. skywalking 几大特点: 多语言自动探针, java ,net core 和 node.js 多种监控手段,
阅读全文
摘要:1. Linux运维基础采集项 做运维,不怕出问题,怕的是出了问题,抓不到现场,两眼摸黑。所以,依靠强大的监控系统,收集尽可能多的指标,意义重大。但哪些指标才是有意义的呢,本着从实践中来的思想,各位工程师在长期摸爬滚打中总结出来的经验最有价值。 在各位运维工程师长期的工作实践中,我们总结了在系统运维
阅读全文
摘要:邮件测试[root@openfalcon_alarm_sender sender]# curl http://172.16.230.191:4000/sender/mail -d "tos=FengJian&subject=xx&content=yy" 微信测试[root@openfalcon_al
阅读全文
摘要:172.16.230.191 包含了 alarm send mail_provider nodata task aggregator agent chat sender配置文件,和0.1 相同 mail_provider 发送邮件功能,和0.1 相同 nodata 用于检查未上报的报警,比如agen
阅读全文
摘要:nodatas 设置agent 状态,其采集指标 agent.alive 上报中断时,通知用户。 hostgroups设置 模版设置
阅读全文
摘要:mongodb_server.py monodb_monitor.py
阅读全文
摘要:#!/bin/env python #-*- coding:utf-8 -*- import json import time import socket import os import re import sys import commands import urllib2, base64 import requests class RedisStats: redis_cli =...
阅读全文
摘要:info.py [{"endpoint":"master","counter":"feng-count","consolFun":"GAUGE","step":60,"filename":"/data/6070/c0/c0c426be18bf40971d0f2b6cc4331818_GAUGE_60
阅读全文
摘要:触发graph的索引全量更新、补救手工操作带来的异常。触发方式为,运行curl -s "http://$hostname:$port/index/updateAll",其中$hostname为graph所在的服务器地址,$port为graph的http监听端口。这种方式,不会删除已上报的监控数据,但
阅读全文
摘要:1. linux客户端部署agent 2. 编写脚本,比如: #!/usr/bin/env python #!-*- coding:utf8 -*- import requests import time import json import random import os while True: time.sleep(20) payload_list = [] ...
阅读全文
摘要:open falcon dashboard 安装
阅读全文
1