文章分类 -  监控

prometheus, altermanager and granafa
摘要:安装部署 helm repo add prometheus-community https://prometheus-community.github.io/helm-charts helm repo update helm fetch prometheus-community/prometheus 阅读全文
posted @ 2023-07-13 19:19 mingtian是吧 阅读(41) 评论(0) 推荐(0) 编辑
摘要:consul 提供了服务发现、配置管理、服务网络、流量管理、api网关等诸多功能。其中最主要的功能是服务发现和配置管理功能 service discovery 定义:服务发现允许应用自动发现其他服务的位置和状态,而无需人工配置或维护服务列表. 作用:当一个服务实例启动或停止时,Consul 能够自动 阅读全文
posted @ 2023-05-29 16:20 mingtian是吧 阅读(12) 评论(0) 推荐(0) 编辑
摘要:[toc] node 11074 8919 blackbox 9719 ##### grafana 修改管理员密码 ``` /usr/share/grafana # grafana-cli admin reset-admin-password 123456 INFO[04-10|02:36:55] 阅读全文
posted @ 2023-04-10 10:41 mingtian是吧 阅读(134) 评论(0) 推荐(0) 编辑
摘要:influxdb 客户端登录 infux -port 18086 -host 127.0.0.1 查看有哪些数据库 show databases 使用数据库 use prometheus 查看表结构 show tag keys from prometheus_1 表查询 seletct * from 阅读全文
posted @ 2023-03-30 17:52 mingtian是吧 阅读(97) 评论(0) 推荐(0) 编辑
摘要:node #节点 数量 sum(kube_node_info) #不可调度的节点数量 sum(kube_node_spec_unschedulable) # 集群cpu 数量 sum(kube_node_status_capacity{resource="cpu"}) # 集群内存 数量 sum(k 阅读全文
posted @ 2023-02-06 19:11 mingtian是吧 阅读(76) 评论(0) 推荐(0) 编辑
摘要:函数 absent() 判断是否存在指标。存在什么都不返回,不存在返回1 absent(kube_pod_container_status_restarts_total) absent(kube_pod_container_status_restarts_totalaaaa) changes() # 阅读全文
posted @ 2023-02-06 09:57 mingtian是吧 阅读(268) 评论(0) 推荐(0) 编辑
摘要:第一部分组件 loki分为服务端(loki)和客户端日志收集工具(promtail),以及客户端查询工具(grafana), 接下来主要介绍服务端的组件(loki)。 服务端(loki) loki是使用go语言编写的,编译完成的loki虽然是一个二进制文件,但是服务内各个组件是以微服务形式运行的,包 阅读全文
posted @ 2022-12-29 16:02 mingtian是吧 阅读(470) 评论(0) 推荐(0) 编辑
摘要:Centos Snmp服务器安装 yum install -y net-snmp net-snmp-utils Snmp的配置/etc/snmp/snmpd.conf Snmp开启 systemctl start snmpd systemctl enable snmpd 进程:ps aux|grep 阅读全文
posted @ 2022-09-01 17:59 mingtian是吧 阅读(26) 评论(0) 推荐(0) 编辑
摘要:cadvisor之前版本在kubelet 中集成,1.12后需要单独安装。 > cadvisor 指标均以`container`开头 > > container_last_seen 最后一次成功抓取的时间戳 ```bash docker pull google/cadvisor-canary:lat 阅读全文
posted @ 2022-06-22 13:40 mingtian是吧 阅读(185) 评论(0) 推荐(0) 编辑
摘要:blackbox 是go 语言编写,通过http https icmp dns tcp 来探测端点并返回指标给promethues **第一步:安装blackbox** blackbox 默认配置[`blackbox.yml`]( https://github.com/prometheus/blac 阅读全文
posted @ 2022-06-20 23:18 mingtian是吧 阅读(774) 评论(0) 推荐(0) 编辑
摘要:聚合函数 格式:<aggr-op>([parameter,] <vector expression>) [without|by (<label list>)] sum 求和 sum(kube_pod_container_status_restarts_total) max 求最大值 max(kube 阅读全文
posted @ 2022-06-16 08:57 mingtian是吧 阅读(305) 评论(0) 推荐(0) 编辑
摘要:**下载安装** **cpu使用率** **内存** **磁盘** **网络流量** **systemd服务指标** **自定义指标** **** 提供操作系统级别的监控指标,`cpu` `memory` `disk space` `diskio` `network` 1. [下载安装](https 阅读全文
posted @ 2022-03-21 22:20 mingtian是吧 阅读(815) 评论(0) 推荐(0) 编辑
摘要:**监控类型** >1. 指标监控 prometheus >1. 白盒监控(内省) 当监控需要数据时应用把数据暴露给promethues >2. 黑盒监控 (探针)-- 监控默默看看应用,不会对应用有侵扰 blackbox >2. 日志监控 elk loki >3. 链路追踪 zipkin jaeg 阅读全文
posted @ 2022-03-21 22:16 mingtian是吧 阅读(183) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示