www.cnblogs.com/ruiyqinrui

开源、架构、Linux C/C++/python AI BI 运维开发自动化运维。 春风桃李花 秋雨梧桐叶。“力尽不知热 但惜夏日长”。夏不惜,秋不获。@ruiY--秦瑞

python爬虫,C编程,嵌入式开发.hadoop大数据,桉树,onenebula云计算架构.linux运维及驱动开发.

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理
您好,如附件,在运维管理这里,有一个事件中心,是可以查询最近一个小时的情况,超出的,有一个pod事件监控

您选择事件 以及输入pod名称就可以查询,但是前提是您安装一下npd组件,把事件采集到sls 才可以持久化查询到
image.png

 internet-deploy-5df788c7c4-fdd2b         0/1     Error     0             8d
internet-deploy-5df788c7c4-pq59x         1/1     Running   0             6h47m
internet-deploy-5df788c7c4-px9bv         0/1     Error     0             2d6h

xxl-job-admin-deploy-9b974cd4b-l2jwp     0/1     OOMKilled   0    

message:"The node was low on resource: memory. Threshold quantity: 300Mi, available: 167600Ki. Container internet was using 3058944Ki, request is 0, has larger consumption of memory. "    触发压力驱逐

k8s 集群内存不足了,(持续很长一段时间了,长时间内存匮乏,可能导致节点崩溃!),最近准备加个节点
主要方案2个:
1、扩展现有k8s 集群节点mem配置---扩内存节点需要重新启动。
2、增加一个节点-----费用相对1直接扩容节点mem 相对高

 

posted on 2024-07-27 09:29  秦瑞It行程实录  阅读(5)  评论(0编辑  收藏  举报
www.cnblogs.com/ruiyqinrui