Kubernetes pod平滑迁移
pod平滑迁移
使用到的命令 (cordon, drain, uncordon)
这三个命令是正式release的1.2新加入的命令,三个命令一起介绍,是因为三个命令配合使用可以实现节点的维护。在1.2之前,因为没有相应的命令支持,如果要维护一个节点,只能stop该节点上的kubelet将该节点退出集群,是集群不在将新的pod调度到该节点上。如果该节点上本生就没有pod在运行,则不会对业务有任何影响。如果该节点上有pod正在运行,kubelet停止后,master会发现该节点不可达,而将该节点标记为notReady状态,不会将新的节点调度到该节点上。同时,会在其他节点上创建新的pod替换该节点上的pod。这种方式虽然能够保证集群的健壮性,但是任然有些暴力,如果业务只有一个副本,而且该副本正好运行在被维护节点上的话,可能仍然会造成业务的短暂中断。
1.2中新加入的这3个命令可以保证维护节点时,平滑的将被维护节点上的业务迁移到其他节点上,保证业务不受影响。如下图所示是一个整个的节点维护的流程(为了方便demo增加了一些查看节点信息的操作):
1)首先查看当前集群所有节点状态,可以看到共六个节点都处于ready状态;
2)查看当前有的pod运行在izj6c6evv00x6w8sbpyokpz 节点上;
3)使用cordon命令将izj6c6evv00x6w8sbpyokpz 标记为不可调度;
1 | [root@cn-hongkong ~] # kubectl cordon izj6c6evv00x6w8sbpyokpz |
4)再使用kubectl get nodes查看节点状态,发现izj6c6evv00x6w8sbpyokpz 虽然还处于Ready状态,但是同时还被禁能了调度,这意味着新的pod将不会被调度到izj6c6evv00x6w8sbpyokpz 上。
5)再查看pod状态,没有任何变化,有的副本仍运行在izj6c6evv00x6w8sbpyokpz上;
6)执行drain命令,将运行在izj6c6evv00x6w8sbpyokpz上运行的pod平滑的赶到其他节点上;
1 | kubectl drain izj6c6evv00x6w8sbpyokpz --delete- local -data --ignore-daemonsets --force |
7)再查看nginx的状态发现,izj6c6evv00x6w8sbpyokpz 上的副本已经被迁移到k-node1上;这时候就可以对izj6c6evv00x6w8sbpyokpz进行一些节点维护的操作,如升级内核,升级Docker等;
8)节点维护完后,使用uncordon命令解锁izj6c6evv00x6w8sbpyokpz,使其重新变得可调度;
1 | kubectl uncordon izj6c6evv00x6w8sbpyokpz |
9)检查节点状态,发现izj6c6evv00x6w8sbpyokpz重新变回Ready状态
微信

支付宝

【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· DeepSeek 开源周回顾「GitHub 热点速览」
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· AI与.NET技术实操系列(二):开始使用ML.NET
· 单线程的Redis速度为什么快?