随笔分类 -  Kubernetes监控手册

摘要:本文翻译自:https://sematext.com/blog/top-10-must-have-alerts-for-kubernetes/ 运行 Kubernetes 集群,显然不止是启动,还需要持续监控,以确保 Kubernetes 中的服务能正常运行。 不过,您不想整天盯着一堆 Kubern 阅读全文
posted @ 2024-08-13 11:46 IT运维监控 阅读(123) 评论(0) 推荐(0) 编辑
摘要:本文会通过一个 Java 应用,演示 Prometheus JMX Exporter 在 Kubernetes 里的部署和配置方式。为了更好地理解 JMX Exporter,我们将使用 Spring Boot Java 应用程序并将所有 JMX 指标导出给 Prometheus。在本指南结束时,您将 阅读全文
posted @ 2024-07-31 14:35 IT运维监控 阅读(119) 评论(0) 推荐(0) 编辑
摘要:写在前面 如果是用的公有云托管的 Kubernetes 集群,控制面的组件都交由云厂商托管的,那作为客户的我们就省事了,基本不用操心 APIServer 的运维。个人也推荐使用云厂商这个服务,毕竟 Kubernetes 还是有点复杂的,升级也不好搞,我们自己来维护整个集群,性价比有点低。当然,如果因 阅读全文
posted @ 2023-01-29 19:21 IT运维监控 阅读(303) 评论(0) 推荐(0) 编辑
摘要:上一篇我们介绍了如何监控Kube-Proxy,Kube-Proxy的/metrics接口没有认证,相对比较容易,这一篇我们介绍一下Kubelet,Kubelet的监控相比Kube-Proxy增加了认证机制,相对更复杂一些。 Kubelet 端口说明 如果你有多台Node节点,可以批量执行 ss -t 阅读全文
posted @ 2023-01-03 10:28 IT运维监控 阅读(1104) 评论(0) 推荐(0) 编辑
摘要:简介 首先,请阅读文章《Kubernetes监控手册01-体系介绍》,回顾一下 Kubernetes 架构,Kube-Proxy 是在所有工作负载节点上的。 Kube-Proxy 默认暴露两个端口,10249用于暴露监控指标,在 /metrics 接口吐出 Prometheus 协议的监控数据: [ 阅读全文
posted @ 2022-12-26 10:50 IT运维监控 阅读(601) 评论(0) 推荐(0) 编辑
摘要:生产环境大都是在 Linux 下的,所以这篇文章我们先来分享如何使用 Categraf 采集 Linux OS 相关的指标。读完本篇内容,你应该可以完成机器层面的监控了。 原理概述 Categraf 作为一款 agent 需要部署到所有目标机器上,因为采集 CPU、内存、IO、进程等指标,是需要读取 阅读全文
posted @ 2022-12-24 17:50 IT运维监控 阅读(224) 评论(0) 推荐(0) 编辑
摘要:咱们这个系列是讲解 Kubernetes 监控,Kubernetes 自身也是要跑在机器上的,那机器的监控自然也是整个体系的一环。机器层面的监控分为两部分,带内网络和带外网络,通过带内网络做监控主要是在OS里部署 agent 的方式,获取 OS 的 CPU、内存、磁盘、IO、网络、进程等相关监控指标 阅读全文
posted @ 2022-12-22 11:45 IT运维监控 阅读(238) 评论(0) 推荐(0) 编辑
摘要:Kubernetes 监控体系驳杂,涉及到的内容非常多,总是感觉摸不到头绪,网上虽然有很多资料,都略显凌乱,没有一个体系化的讲解,今天开始,我们准备撰写一系列文章,把 Kubernetes 监控说透,从如何采集数据,到重点关注哪些指标,怎么做监控大盘,怎么配告警规则,全部囊括其中,让大家彻底理解 K 阅读全文
posted @ 2022-12-20 11:25 IT运维监控 阅读(86) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示