RKE 集群升级指南
使用 RKE 部署 Kubernetes 后,您可以升级 Kubernetes 集群中组件的版本、编辑Kubernetes services 列表或编辑插件。
先决条件
-
保证cluster.yml缺少system_images的说明和配置。
-
保证工作目录中有管理Kubernetes 集群状态所需的文件,不同版本的 RKE 使用不同的文件管理 Kubernetes 集群状态。
RKE v0.2.0 及以上的版本使用cluster.rkestate文件管理集群状态。cluster.rkestate文件中含有集群的当前状态,包括 RKE 配置和证书等信息。
这个文件和cluster.yml位于同一目录下。
cluster.rkestate文件非常重要,控制集群和升级集群的时候都需要用到这个文件,请妥善保管该文件。
列举支持的 Kubernetes 版本
例如:
rke config --list-version --all
v1.15.3-rancher2-1
v1.13.10-rancher1-2
v1.14.6-rancher2-1
v1.16.0-beta.1-rancher1-1
升级 Kubernetes 版本
打开cluster.yml文件,找到 kubernetes_version字符串,将原有的版本号修改为新的版本号即可。
kubernetes_version: "v1.15.5-rancher1-1"
然后在命令行工具中输入 rke up,使用cluster.yml文件指定的新版本器启动 RKE。
rke up --config cluster.yml
Kubernetes 版本优先级
如果在kubernetes_version和system_images中都定义了 Kubernetes 版本,system_images中定义的版本会生效,而kubernetes_version中定义的版本不会生效。如果两者都没有定义 Kubernetes 版本,RKE 会使用默认的 Kubernetes 版本。
升级服务
您可以修改服务的对象,或添加extra_args,然后运行rke up命令,升级服务。
说明: service_cluster_ip_range 和 cluster_cidr不可修改。
手动升级节点
v1.1.0 开始可用
您可以手动升级每种类型的节点。建议您先升级 etcd 节点,然后升级 controlplane 节点,最后再升级 worker 节点。
回滚 Kubernetes 版本
v1.1.0 开始可用
您可以使用快照,将集群恢复到使用上一个 Kubernetes 版本的时候。
问题排查
v1.1.0 开始可用
如果一个节点在升级之后不出现,rke up指令会报错。
如果实际不可用的节点超出了配置文件中限定不可用节点数量的最大值,则不会升级。
如果升级停止了,您可能需要修改一些不可用的节点,或者将它从集群中移除,然后继续升级。
一个不可用的节点可能处于以下几种状态:
- 关机
- 不可用
- 用户执行了 drain 命令,将该节点上运行的 pod 驱逐到了其他节点上,导致该节点上没有 kubelets
- 升级失败
以下是升级失败的常见场景:
- 升级过程中,不可用的节点数量达到预设的最大值,RKE CLI 会报错,停止工作。
- 如果一些节点升级失败,但是不可用的节点数量小于预设的最大值,RKE CLI 会将这些节点升级失败的事项记录在日志里,然后跳过这些节点,升级其他节点和插件。完成插件升级或,RKE 会报错,然后退出。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· C#/.NET/.NET Core优秀项目和框架2025年2月简报
· Manus爆火,是硬核还是营销?
· 一文读懂知识蒸馏
· 终于写完轮子一部分:tcp代理 了,记录一下