在K8S中，高可用集群架构是什么样？

在 Kubernetes（K8S）中，高可用集群架构是确保系统稳定性和可靠性的关键。以下是对 K8S 高可用集群架构的详细描述：

核心思想：
- 让 Kubernetes master 节点中的各类组件具备高可用性，消除单点故障，保证整个集群能够持续稳定地提供服务，即使在部分组件或节点出现故障的情况下，也能维持正常运转。
主要组件及高可用实现方式
- kube-apiserver
  - 多实例部署：在多个主节点上部署 kube-apiserver 实例。由于其本身无状态，可通过负载均衡器分发流量，对外提供统一的访问入口。
  - 负载均衡器配置：可以使用云厂商提供的负载均衡服务，如 AWS ELB、GCP Load Balancer 等外部负载均衡器；也可以使用 HAProxy、Keepalived 或 Nginx 等内部负载均衡器。通过配置虚拟 IP（VIP），利用 Keepalived 实现高可用的负载均衡服务，当某个 apiserver 实例宕机时，负载均衡器能自动将流量转发到其他健康的节点。
- etcd
  - 多节点集群：推荐采用奇数个节点（如 3 或 5 个节点）来构建 etcd 集群，以实现分布式一致性。这样可以确保在单个节点故障时，其他节点仍能继续提供服务，满足大多数（quorum）节点可用的要求，即 N/2+1 个节点可用。
  - 数据持久化与备份：要确保 etcd 数据的持久化存储，并定期进行备份，以防止数据丢失。同时，etcd 节点间的网络延迟应尽可能低，以保证写入性能和一致性。
- kube-scheduler
  - 多实例运行与选举机制：可以以多实例模式运行，但通常只有一个活跃的 kube-scheduler 实例在工作。通过基于 leader-elect 的选举机制，确保在同一时间只有一个实例处于领导地位并执行调度任务，其他实例作为备用，当活跃实例出现故障时，备用实例能够迅速接管工作。
- kube-controller-manager
  - 类似 kube-scheduler 的机制：与 kube-scheduler 类似，一个集群中通常只有一个活跃的 kube-controller-manager 实例在运行，负责管理集群的控制逻辑。通过领导者选举功能，多个实例之间竞争领导权，保证在活跃实例故障时，能够有其他实例及时接替，继续执行控制管理工作。
工作节点的高可用
- 多节点分布：部署多个工作节点，避免因部分节点故障导致整个集群不可用。当某些工作节点出现故障时，其他正常工作的节点可以继续承担容器运行任务。
- Pod 调度策略
  - 合理设置亲和性和反亲和性规则：通过配置 PodAntiAffinity 和 NodeSelector 等策略，避免同一应用的副本集中部署到单个节点上，实现 Pod 在多个节点之间的均匀分布，提高应用的容错能力。
  - 使用 PodDisruptionBudget（PDB）：可以在维护期间控制受影响的 Pod 数量，确保应用不会因为节点维护或其他操作而受到过大影响，保证应用的可用性。
- 网络插件选择：选择支持高可用性的容器网络接口（CNI）插件，如 Calico、Flannel、Cilium 等，确保每个节点之间以及节点与外部的网络通信畅通无阻，避免因网络问题导致节点之间的通信中断或异常。
存储的高可用
- 存储选型
  - 云原生存储：对于需要持久化存储的应用，可以选择 Ceph、Rook 等分布式存储系统，它们具有良好的可扩展性和高可用性，能够在多个节点上分布式存储数据，避免单点故障。
  - 云厂商存储：利用云服务提供商提供的存储服务，如 AWS EBS、GCP Persistent Disk 等，这些存储服务通常具有高可用特性，并且可以根据需求灵活配置和管理。
- 数据备份：使用专门的工具，如 Velero，定期备份 Kubernetes 的持久卷（PV）数据，以便在发生数据丢失或损坏的情况下能够快速恢复数据。
监控与自动化运维
- 监控系统：部署 Prometheus + Grafana 等监控工具，实时监控集群的状态，包括关键组件的性能指标（如 kube-apiserver 的延迟、etcd 的健康状态等）、资源使用情况（如 CPU、内存、磁盘等）以及应用程序的运行状态等，及时发现潜在的问题并采取措施解决。
- 自动恢复：配置 Cluster Autoscaler 和 Node Auto-repair 等工具，确保在节点或 Pod 出现故障时能够自动进行修复和恢复。例如，当某个节点的资源不足或出现故障时，Cluster Autoscaler 可以自动增加或删除节点；Node Auto-repair 可以检测到节点故障并尝试自动修复，如果无法修复则将其从集群中移除。
- 灾难恢复计划：制定完整的灾难恢复计划，包括定期测试 etcd 数据的恢复流程、备份数据的验证和恢复演练等，确保在发生重大故障或灾难事件时能够快速恢复集群的正常运作，减少业务中断时间。