因磁盘压力而驱逐Pod

k8s 1.15.0

问题现象

node2上产生磁盘压力前状态

node2上产生磁盘压力后guaranteed Pod和ds Pod被驱逐

nginx-deployment Pod被驱逐后容忍污点调度到node2,kubelet二次确认否决,继续驱逐

pkg/kubelet/eviction/eviction_manager.go
Admit方法
1. 接受关键Pod
2. 节点存在内存压力,接受qos非BestEffort的Pod
3. 节点存在内存压力,接受qos是BestEffort且可以容忍当前污点的Pod
4. 拒绝该Pod,Pod Phase设置为Failed

关键Pod

https://v1-22.docs.kubernetes.io/zh/docs/reference/command-line-tools-reference/feature-gates/
PodPriority默认开启

ExperimentalCriticalPodAnnotation已在1.13版本废弃,推荐优先级设置。

成为关键Pod的充分条件(满足之一即可)
1.开启PodPriority特性开关,设置Pod优先级达到20亿以上
2.开启ExperimentalCriticalPodAnnotation特性开关,kube-system命名空间下Pod带有注解scheduler.alpha.kubernetes.io/critical-pod且值是""
pkg/kubelet/types/pod_update.go
IsCriticalPod函数

验证高优先级Pod是否不会被驱逐

kube-system命名空间下设置了20亿优先级的Pod依然被驱逐

pkg/kubelet/eviction/eviction_manager.go
synchronize方法

对应kubelet日志

evictPod方法
只有Pod是关键Pod且是静态Pod,才不会被驱逐。

例如kube-apiserver这个静态Pod满足不驱逐的条件

在k8s新版本v1.19.0中,Pod设置了20亿优先级后不会被驱逐,即Pod spec中增加priorityClassName: system-cluster-critical。准确来说,Pod spec.priority数值>=20亿,就不会被驱逐,priority无法直接指定,需要通过spec.priorityClass字段来指定。

参考资料

深入分析Kubernetes Critical Pod(二)

posted on 2023-06-18 17:18  王景迁  阅读(59)  评论(0编辑  收藏  举报

导航