随笔分类 -  监控

linux free 内存计算的核心处理代码
摘要:如果大家使用了node exporter 进行系统的监控,肯定会存在关于系统可用内存以及内存使用率的问题 node exporter 提供了好多指标,但是关于内存的基本都是通过/pro/meminfo 获取的,但是不同linux 内核 对于数据的处理是不一样的,以下是关于free 命令内存计算的核心 阅读全文

posted @ 2020-09-05 18:39 荣锋亮 阅读(348) 评论(0) 推荐(0) 编辑

使用nginx-prometheus-exporter 监控nginx
摘要:因为nginx 已经提供了stub_status 模块,一般我们可以基于此进行监控,目前官方提供了一个exporter 尽管有一些限制(web必须使用8080)。以下是一个简单的学习使用 环境准备 docker-compose 文件 注意使用了ranadeeppolavarapu 提供的nginx 阅读全文

posted @ 2020-08-29 00:48 荣锋亮 阅读(7913) 评论(0) 推荐(0) 编辑

grafana dashboard 分享的几种处理方法
摘要:prometheus+grafan 已经成为了大家进行系统监控的标配了,但是很多时候我们为了给予用户一个方便的dashboard查看系统 的metrics 请求,可以会进行grafan dashboard 的分享,大家的解决方法可能很多,基于grafana 分享的(需要修改配置)也有 基于grafa 阅读全文

posted @ 2020-08-17 17:48 荣锋亮 阅读(4688) 评论(0) 推荐(0) 编辑

prometheus 自定义服务发现的几种实现方法
摘要:prometheus 具有强大的生态系统,同时也已经内置了好多服务发现的支持(file,consul,k8s,ec2,dns,openstack,....) 自己开发自定义的服务发现机制 官方提供了参考的说明文档,主要的问题是我们需要修改prometheus 的代码,同时自己进行构建,很多时候我们会 阅读全文

posted @ 2020-08-17 13:37 荣锋亮 阅读(1909) 评论(0) 推荐(0) 编辑

使用nginx limit_rate 解决用户下载限速
摘要:问题 最近有一个文件下载的服务,下载流量很大,我们的带宽有限,很多时候系统有很多人同时在下载文件 尽管客户端已经做了一些断点续传以及重试,但是在用户访问量较大的时候容易出现链接因为带宽问题被 关闭,造成用户文件下载失败次数比较多,因为文件偏大, 很多时候整个元数据块下载不完整,造成了很差 的用户体验 阅读全文

posted @ 2020-07-17 15:54 荣锋亮 阅读(4525) 评论(0) 推荐(0) 编辑

hazelcast-jet docker 运行试用
摘要:上次有简单写过关于潜入模式的使用,以下是一个使用server 模式基于docker-compose 运行的demo hazelcast-jet 参考架构 环境准备 docker-compose 包含了一个management (注意多实例管理需要license)同时添加了prometheus 支持 阅读全文

posted @ 2020-07-15 20:16 荣锋亮 阅读(487) 评论(0) 推荐(0) 编辑

amqproxy 一个很不错的rabbitmq proxy
摘要:amqproxy 是由cloudamqp公司开源的(此公司专门搞rabbitmq 服务的)开发基于crystal(一个小众语言,但是很不错), 同时今天也转了一片此公司的文章 https://www.cloudamqp.com/blog/2019-05-29-maintaining-long-liv 阅读全文

posted @ 2020-07-01 20:46 荣锋亮 阅读(1280) 评论(0) 推荐(0) 编辑

Maintaining Long-Lived Connections with AMQProxy
摘要:转自:https://www.cloudamqp.com/blog/2019-05-29-maintaining-long-lived-connections-with-AMQProxy.html Some applications cannot maintain long-lived connec 阅读全文

posted @ 2020-07-01 17:08 荣锋亮 阅读(371) 评论(0) 推荐(0) 编辑

VictoriaMetrics v1.36.0 的一些新功能
摘要:VictoriaMetrics 1.36.0 4个小时前发布了,以下是一些比较好的特性 支持replicationFactor 主要是进行数据复制,保证系统的可靠 vmstorage 性能提升 增强查询 vmauth 与vmalert 因为压缩不能工作问题 说明 VictoriaMetrics 的迭 阅读全文

posted @ 2020-05-28 08:55 荣锋亮 阅读(451) 评论(0) 推荐(0) 编辑

VictoriaMetrics 集成karma
摘要:以前有介绍过karma,以下是一个集成,实际上这个肯定是可以跑通的,因为依赖的都是alertmanager这个是都兼容的 环境准备 docker-compose 文件 version: "3" services: vmstorage: image: victoriametrics/vmstorage 阅读全文

posted @ 2020-05-22 21:04 荣锋亮 阅读(601) 评论(0) 推荐(0) 编辑

VictoriaMetrics 关于ha以及灾备的处理方法
摘要:解决方法来自github 的一个issue,以下只是简单整理下 问题 vmstorage 节点在出现故障的时候,或者磁盘出现问题的时候,部分指标可能会丢失 提供的解决方法 集成vmagent,进行多集群数据的复制,我们可以通过指定多个remoteWrite.url (注意次地址为不通集群的vmins 阅读全文

posted @ 2020-05-22 20:05 荣锋亮 阅读(805) 评论(0) 推荐(0) 编辑

VictoriaMetrics vmalert 集成vmauth 错误问题原因
摘要:通过调试发现通过vmauth 默认的编码是gzip的,所以会有问题,通过仔细查看vmalert 的命令参数已经包含了 禁用gzip 说明:最新版本中作者已经修复了这个问题的bug,老版本可以参考此方法解决 参数 -http.disableResponseCompression Disable com 阅读全文

posted @ 2020-05-22 19:43 荣锋亮 阅读(441) 评论(0) 推荐(0) 编辑

VictoriaMetrics vmalert 使用
摘要:以下是关于vmalert 的使用,主要是测试下各个组件的集成 环境准备 注意环境集成了vmauth,vmagent 等好多VictoriaMetrics的组件,基本上就是一个比较完备的prometheus集成环境了 docker-compose 文件 说明目前vmalert 通过vmauth 会有错 阅读全文

posted @ 2020-05-22 17:27 荣锋亮 阅读(2581) 评论(0) 推荐(0) 编辑

VictoriaMetrics vmagent 使用
摘要:以下是关于使用 vmagent替换prometheus 的简单使用,可以实现push 模式的metrics 处理 环境准备 docker-compose 文件 version: "3" services: vmstorage: image: victoriametrics/vmstorage por 阅读全文

posted @ 2020-05-22 16:07 荣锋亮 阅读(2457) 评论(0) 推荐(0) 编辑

VictoriaMetrics vmauth 使用
摘要:前边有简单说明过vmauth相关的参数,以下是关于配置的使用说明,以下是一个简单的demo 说明 环境准备 docker-compose version: "3" services: prometheus: image: prom/prometheus ports: - 9090:9090 volu 阅读全文

posted @ 2020-05-22 14:38 荣锋亮 阅读(1564) 评论(0) 推荐(0) 编辑

VictoriaMetrics集群模式的一些说明
摘要:如果看了官方介绍的话,VictoriaMetrics 对于集群的处理只有vmstorage 是有状态的,其他节点(vmselect,vminsert都是无状态的) 但是一些细节上的目前官方没有很清晰的说明,以下是一些简单的说明 vmselect 以及vminsert 的storagenode 配置 阅读全文

posted @ 2020-05-22 07:27 荣锋亮 阅读(1508) 评论(0) 推荐(0) 编辑

promgen prometheus 配置文件生成工具
摘要:promgen是一个方便的prometheus 配置文件生成工具,可以帮助我们生成以及管理prometheus的配置文件,同时可以配置案例alert 规则以及通知选项 基于python开发 参考架构 promgen使用模式 worker 模式(push) 说明依赖celery cron 模式(pul 阅读全文

posted @ 2020-05-21 11:01 荣锋亮 阅读(2185) 评论(6) 推荐(0) 编辑

zabbix docker-compose 运行配置
摘要:网上看到一堆使用docker-compose 运行zabbix ,都不台好用,或者因为版本问题,以下是一个整理的 docker-compose ,可以参考 docker-compose version: "3" services: mysql-server: image: mysql:5.7.16 阅读全文

posted @ 2020-05-20 20:07 荣锋亮 阅读(2820) 评论(0) 推荐(0) 编辑

grafana 7.0 支持分布式追踪框架的dashboard 展示
摘要:grafana 7.0 最近发布了,添加了对于分布式追踪(opentracing)的展示支持,同时界面ui也有调整 以下是一个简单的试用 环境准备 docker-compose 文件 version: "3" services: grafana: image: grafana/grafana:7.0 阅读全文

posted @ 2020-05-19 14:10 荣锋亮 阅读(2575) 评论(0) 推荐(0) 编辑

promcat.io 由sysdig 托管的企业级prometheus监控网站
摘要:promcat.io 是由sydig 托管的关于prometheus监控相关的知识网站,我们可以找到相关的exporter 以及alert配置,目前还在进行中 但是是一个不错的prometheus知识网站,同样也有一个不错的博客网站https://awesome-prometheus-alerts. 阅读全文

posted @ 2020-05-17 18:16 荣锋亮 阅读(369) 评论(0) 推荐(0) 编辑

导航