Prometheus 监控之 zookeeper
Git 项目地址:https://github.com/jiankunking/zookeeper_exporter
exporter 下载地址:https://github.com/carlpett/zookeeper_exporter/releases/download/v1.0.2/zookeeper_exporter
注意:export 适合 zookeeper3.4+
①下载 zookeeper_export
wget https://github.com/carlpett/zookeeper_exporter/releases/download/v1.0.2/zookeeper_exporter
②启动 zookeeper_export
nohup /usr/local/bin/zookeeper_exporter >>/dev/null 2>&1 &
③查看是否正常
④将 export 加入到 prometheus 服务端。
⑤登陆 grafana,导入模板;搜索 Zookeeper Exporer Overview 或者 拷贝 pid 9236
zookeeper alter 监控参考如下:
groups : - name: zookeeperStatsAlert rules: - alert: 堆积请求数过大 expr : avg(zk_outstanding_requests) by (instance) > 10 for : 1m labels: severity: critical annotations: summary: "Instance {{ $labels.instance }} " description: "积请求数过大" - alert: 阻塞中的 sync 过多 expr : avg(zk_pending_syncs) by (instance) > 10 for : 1m labels: severity: critical annotations: summary: "Instance {{ $labels.instance }} " description: "塞中的 sync 过多" - alert: 平均响应延迟过高 expr : avg(zk_avg_latency) by (instance) > 10 for : 1m labels: severity: critical annotations: summary: "Instance {{ $labels.instance }} " description: '平均响应延迟过高' - alert: 打开文件描述符数大于系统设定的大小 expr : zk_open_file_descriptor_count > zk_max_file_descriptor_count * 0.85 for : 1m labels: severity: critical annotations: summary: "Instance {{ $labels.instance }} " description: '打开文件描述符数大于系统设定的大小' - alert: zookeeper服务器宕机 expr : zk_up == 0 for : 1m labels: severity: critical annotations: summary: "Instance {{ $labels.instance }} " description: 'zookeeper服务器宕机' - alert: zk主节点丢失 expr : absent(zk_server_state{state= "leader" }) != 1 for : 1m labels: severity: critical annotations: summary: "Instance {{ $labels.instance }} " description: 'zk主节点丢失' |
zk_outstanding_requests 堆积请求数
zk_pending_syncs 阻塞中的 sync 操作
zk_avg_latency 平均 响应延迟
zk_open_file_descriptor_count 打开 文件描述符 数
zk_max_file_descriptor_count 最大 文件描述符 数
zk_up 1
zk_server_state 主从状态
zk_num_alive_connections 活跃连接数
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 25岁的心里话
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· 零经验选手,Compose 一天开发一款小游戏!
· 因为Apifox不支持离线,我果断选择了Apipost!
· 通过 API 将Deepseek响应流式内容输出到前端