您好,如附件,在运维管理这里,有一个事件中心,是可以查询最近一个小时的情况,超出的,有一个pod事件监控
您选择事件 以及输入pod名称就可以查询,但是前提是您安装一下npd组件,把事件采集到sls 才可以持久化查询到
image.png
internet-deploy-5df788c7c4-fdd2b 0/1 Error 0 8d
internet-deploy-5df788c7c4-pq59x 1/1 Running 0 6h47m
internet-deploy-5df788c7c4-px9bv 0/1 Error 0 2d6h
xxl-job-admin-deploy-9b974cd4b-l2jwp 0/1 OOMKilled 0
message:"The node was low on resource: memory. Threshold quantity: 300Mi, available: 167600Ki. Container internet was using 3058944Ki, request is 0, has larger consumption of memory. " 触发压力驱逐
k8s 集群内存不足了,(持续很长一段时间了,长时间内存匮乏,可能导致节点崩溃!),最近准备加个节点
主要方案2个:
1、扩展现有k8s 集群节点mem配置---扩内存节点需要重新启动。
2、增加一个节点-----费用相对1直接扩容节点mem 相对高