07 2021 档案
摘要:问题1:单node上容器网段pod被隔离 现象: 1)生产环境节点node_A重启后,上面有几个pod_1(pod namespace的pod) 的init container初始化失败,报错连接svc/kubernetes(apiserver的service) timed out 2)该节点上:容
阅读全文
摘要:说明:本文为转载文章,转自 Prometheus Operator 安装完成后会有很多默认的监控指标,一不注意就大量的报警产生,所以我们非常有必要了解下这些常用的监控指标,有部分指标很有可能对于我们自己的业务可有可无,所以可以适当的进行修改,这里我们就来对常用的几个指标进行简单的说明。 1. Kub
阅读全文
摘要:一、简介 1.1、监控系统概述 注意:监控和告警 是有区别的,注意区分 监控系统设计: 评估系统的业务流程 、业务种类、架构体系。对于各个地方的细节需要一定程度的认知 分类出所需的监控项种类: 业务监控:QPS,PV,UV,SUCC_RATE,投诉率 ... 系统监控:CPU,MEM,Load,IO
阅读全文