随笔分类 -  监控

1
摘要:Thanos[1] 和 VictoriaMetrics[2] 都是用来作为 Prometheus 长期存储的成熟方案,其中 VictoriaMetrics 也开源了其集群版本[3],功能更加强大。这两种解决方案都提供了以下功能: 长期存储,可以保留任意时间的监控数据。 对多个 Prometheus 阅读全文
posted @ 2022-10-08 10:27 fengjian1585 阅读(516) 评论(0) 推荐(0) 编辑
摘要:容器-promQL语法之内存指标 在容器内进行内存监控的常用指标包括 1、 内存中的cache用量 container_memory_cache 2、 常驻的内存用量 container_memory_rss 3、 交换分区用量 container_memory_swap 4、 内存的总占用量 co 阅读全文
posted @ 2022-06-29 14:29 fengjian1585 阅读(1330) 评论(0) 推荐(0) 编辑
摘要:简介 VictoriaMetrics集群方案,除了有单节点方案的优点以外,还可以做到水平扩容,当有大量数据存储时,VictoriaMetrics集群方案是个不错的选择。 官方建议是100w/s以下的数据点抓取,使用单节点版,单节点版可以省更多的CPU、内存、磁盘资源。 但是,当遇到如下问题可以考虑集 阅读全文
posted @ 2022-01-24 16:47 fengjian1585 阅读(2629) 评论(0) 推荐(0) 编辑
摘要:夜莺v5 报警python脚本 #!/usr/bin/python # -*- coding: UTF-8 -*- # # n9e-server把告警事件通过stdin的方式传入notify.py,notify.py从事件中解析出接收人信息、拼出通知内容,发送通知 # 脚本的灵活性高,要接入短信、电 阅读全文
posted @ 2021-08-05 15:42 fengjian1585 阅读(822) 评论(0) 推荐(0) 编辑
摘要:n9e 监控系统 需要连接 job ams transfer ,在不同的IDC机房 可以采用 rinetd 或者 rein 转发端口 我没测试过。。。。。。。 阅读全文
posted @ 2021-04-08 16:17 fengjian1585 阅读(75) 评论(0) 推荐(0) 编辑
摘要:夜莺 上传 数据 curl --location --request POST 'http://192.168.10.121:82/api/transfer/data' \ --header 'Content-Type: application/json' \ --data '[ { "end": 阅读全文
posted @ 2021-01-15 14:48 fengjian1585 阅读(381) 评论(0) 推荐(0) 编辑
摘要:skywalking cluster: selector: ${SW_CLUSTER:standalone} standalone: # Please check your ZooKeeper is 3.5+, However, it is also compatible with ZooKeepe 阅读全文
posted @ 2020-07-14 13:16 fengjian1585 阅读(2365) 评论(0) 推荐(0) 编辑
摘要:夜莺监控+prometheus 阅读全文
posted @ 2020-06-26 16:06 fengjian1585 阅读(2443) 评论(0) 推荐(0) 编辑
摘要:skywalking 是一个可观测分析平台(OAP) 和 应用性能管理系统(APM) 提供分布式链路追踪, 服务网格 遥测分析, 度量(metric) 聚合和可视化一体化解决方案. skywalking 几大特点: 多语言自动探针, java ,net core 和 node.js 多种监控手段,  阅读全文
posted @ 2019-09-24 10:31 fengjian1585 阅读(707) 评论(0) 推荐(0) 编辑
摘要:1. Linux运维基础采集项 做运维,不怕出问题,怕的是出了问题,抓不到现场,两眼摸黑。所以,依靠强大的监控系统,收集尽可能多的指标,意义重大。但哪些指标才是有意义的呢,本着从实践中来的思想,各位工程师在长期摸爬滚打中总结出来的经验最有价值。 在各位运维工程师长期的工作实践中,我们总结了在系统运维 阅读全文
posted @ 2018-07-09 09:55 fengjian1585 阅读(706) 评论(0) 推荐(0) 编辑
摘要:邮件测试[root@openfalcon_alarm_sender sender]# curl http://172.16.230.191:4000/sender/mail -d "tos=FengJian&subject=xx&content=yy" 微信测试[root@openfalcon_al 阅读全文
posted @ 2017-07-12 10:49 fengjian1585 阅读(274) 评论(0) 推荐(0) 编辑
摘要:172.16.230.191 包含了 alarm send mail_provider nodata task aggregator agent chat sender配置文件,和0.1 相同 mail_provider 发送邮件功能,和0.1 相同 nodata 用于检查未上报的报警,比如agen 阅读全文
posted @ 2017-06-21 10:41 fengjian1585 阅读(728) 评论(0) 推荐(0) 编辑
摘要:nodatas 设置agent 状态,其采集指标 agent.alive 上报中断时,通知用户。 hostgroups设置 模版设置 阅读全文
posted @ 2016-11-16 15:10 fengjian1585 阅读(247) 评论(0) 推荐(0) 编辑
摘要:mongodb_server.py monodb_monitor.py 阅读全文
posted @ 2016-10-21 11:47 fengjian1585 阅读(709) 评论(0) 推荐(0) 编辑
摘要:#!/bin/env python #-*- coding:utf-8 -*- import json import time import socket import os import re import sys import commands import urllib2, base64 import requests class RedisStats: redis_cli =... 阅读全文
posted @ 2016-10-19 22:32 fengjian1585 阅读(2680) 评论(0) 推荐(1) 编辑
摘要:info.py [{"endpoint":"master","counter":"feng-count","consolFun":"GAUGE","step":60,"filename":"/data/6070/c0/c0c426be18bf40971d0f2b6cc4331818_GAUGE_60 阅读全文
posted @ 2016-06-22 11:58 fengjian1585 阅读(259) 评论(0) 推荐(0) 编辑
摘要:触发graph的索引全量更新、补救手工操作带来的异常。触发方式为,运行curl -s "http://$hostname:$port/index/updateAll",其中$hostname为graph所在的服务器地址,$port为graph的http监听端口。这种方式,不会删除已上报的监控数据,但 阅读全文
posted @ 2016-06-22 11:50 fengjian1585 阅读(368) 评论(0) 推荐(0) 编辑
摘要:1. linux客户端部署agent 2. 编写脚本,比如: #!/usr/bin/env python #!-*- coding:utf8 -*- import requests import time import json import random import os while True: time.sleep(20) payload_list = [] ... 阅读全文
posted @ 2016-06-22 11:49 fengjian1585 阅读(2894) 评论(1) 推荐(0) 编辑
摘要:open falcon dashboard 安装 阅读全文
posted @ 2016-05-27 18:05 fengjian1585 阅读(368) 评论(0) 推荐(0) 编辑

1