RKE 集群升级指南

使用 RKE 部署 Kubernetes 后,您可以升级 Kubernetes 集群中组件的版本、编辑Kubernetes services 列表或编辑插件。

先决条件

  • 保证cluster.yml缺少system_images的说明和配置。

  • 保证工作目录中有管理Kubernetes 集群状态所需的文件,不同版本的 RKE 使用不同的文件管理 Kubernetes 集群状态。

RKE v0.2.0 及以上的版本使用cluster.rkestate文件管理集群状态。cluster.rkestate文件中含有集群的当前状态,包括 RKE 配置和证书等信息。

这个文件和cluster.yml位于同一目录下。

cluster.rkestate文件非常重要,控制集群和升级集群的时候都需要用到这个文件,请妥善保管该文件。

列举支持的 Kubernetes 版本

例如:

rke config --list-version --all
v1.15.3-rancher2-1
v1.13.10-rancher1-2
v1.14.6-rancher2-1
v1.16.0-beta.1-rancher1-1

升级 Kubernetes 版本

打开cluster.yml文件,找到 kubernetes_version字符串,将原有的版本号修改为新的版本号即可。

kubernetes_version: "v1.15.5-rancher1-1"

然后在命令行工具中输入 rke up,使用cluster.yml文件指定的新版本器启动 RKE。

rke up --config cluster.yml

Kubernetes 版本优先级

如果在kubernetes_version和system_images中都定义了 Kubernetes 版本,system_images中定义的版本会生效,而kubernetes_version中定义的版本不会生效。如果两者都没有定义 Kubernetes 版本,RKE 会使用默认的 Kubernetes 版本。

升级服务

您可以修改服务的对象,或添加extra_args,然后运行rke up命令,升级服务。

说明: service_cluster_ip_range 和 cluster_cidr不可修改。

手动升级节点

v1.1.0 开始可用

您可以手动升级每种类型的节点。建议您先升级 etcd 节点,然后升级 controlplane 节点,最后再升级 worker 节点。

回滚 Kubernetes 版本

v1.1.0 开始可用

您可以使用快照,将集群恢复到使用上一个 Kubernetes 版本的时候。

问题排查

v1.1.0 开始可用

如果一个节点在升级之后不出现,rke up指令会报错。

如果实际不可用的节点超出了配置文件中限定不可用节点数量的最大值,则不会升级。

如果升级停止了,您可能需要修改一些不可用的节点,或者将它从集群中移除,然后继续升级。

一个不可用的节点可能处于以下几种状态:

  • 关机
  • 不可用
  • 用户执行了 drain 命令,将该节点上运行的 pod 驱逐到了其他节点上,导致该节点上没有 kubelets
  • 升级失败

以下是升级失败的常见场景:

  • 升级过程中,不可用的节点数量达到预设的最大值,RKE CLI 会报错,停止工作。
  • 如果一些节点升级失败,但是不可用的节点数量小于预设的最大值,RKE CLI 会将这些节点升级失败的事项记录在日志里,然后跳过这些节点,升级其他节点和插件。完成插件升级或,RKE 会报错,然后退出。
posted @ 2022-03-10 17:40  Varden  阅读(525)  评论(0编辑  收藏  举报