如何优雅的使用TenSunS管理Blackbox站点监控
🦄概述
后羿 - TenSunS(原ConsulManager)是一个使用Flask+Vue开发,基于Consul的WEB运维平台,弥补了Consul官方UI对Services管理的不足;并且基于Consul的服务发现与键值存储:实现了Prometheus自动发现多云厂商各资源信息;基于Blackbox对站点监控的可视化维护;以及对自建与云上资源的优雅管理与展示。
仓库地址:https://github.com/starsliao/TenSunS
Consul字段设计说明
- 所有数据存在一个名为
blackbox_exporter
的Services项中,每个监控目标为一个子Service。 - 每个Service使用Meta的kv保存监控目标的属性:
module
,company
,project
,env
,name
,instance
,分别表示:监控类型,公司部门,项目,环境,名称,实例url。 - 新增监控时,监控类型字段(
module
)和Blackbox配置中的module
必须保持一致。 - 前5个字段合并即为consul的serviceID,作为唯一监控项标识
配置Prometheus与Blackbox
原理:基于Consul实现Prometheus的自动发现功能配置
- 把Consul每个service的Meta的KV关联到Prometheus每个指标的标签。
- 根据每个指标的标签来对监控目标分类,分组,方便管理维护。
1. 配置Blackbox_Exporter
- 在Web页面点击
Blackbox 站点监控/Blackbox 配置
,点击复制配置
。 - 编辑blackbox_exporter的
blackbox.yml
,清空已有的配置,把复制的内容粘贴进去,重启blackbox_exporter。
2. 配置Prometheus
- 在Web页面点击
Blackbox 站点监控/Prometheus 配置
,点击复制配置
。 - 编辑Prometheus的
prometheus.yml
,把复制的内容追加到最后,reload或重启Prometheus。
3. 配置Prometheus告警规则
- 在Web页面点击
Blackbox 站点监控/告警规则
,点击复制配置
。 - 编辑Prometheus的
rules.yml
,把复制的内容追加到最后,reload或重启Prometheus。
4. 查看Prometheus
- 在Prometheus的Web页面中,点击Status-Targets,能看到新增的Job即表示数据同步到Prometheus。
5. 导入Blackbox Exporter Dashboard
- 支持Grafana 8,基于blackbox_exporter 0.19.0设计
- 采用图表+曲线图方式展示TCP,ICMP,HTTPS的服务状态,各阶段请求延时,HTTPS证书信息等
- 优化展示效果,支持监控目标的分组、分类级联展示,多服务同时对比展示。
- 导入ID:9965
- 详细URL:https://grafana.com/grafana/dashboards/9965
批量导入脚本【现已支持直接在Web页面上批量导入监控站点!】
在项目仓库根目录的tools
目录下:编辑blackbox-instance.list
,写入监控目标的信息:监控类型,公司/部门,项目,环境,名称,实例url,每行一个,空格分隔。
注意:前5个字段组合起来必须唯一,作为一个监控项的ID。即Consul的ServiceID
再修改导入脚本blackbox-input.py
中的consul_token和consul_url,保存后执行blackbox-input.py
,即可导入所有监控目标到Consul,并符合Prometheus的自动发现配置。
StarsL.cn
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 记一次.NET内存居高不下排查解决与启示