【VMware vSAN】VMware vSAN 9 新功能?
vSAN 是 VMware 推出的软件定义存储方案,通过聚合 vSphere 集群中 X86 服务器的本地磁盘并形成一个抽象的存储池以供虚拟机/容器等负载使用。VMware vSAN 最早于 2014 年发布,至今已过去 10 年时间,每一年里都发生了许许多多的变化,有的可能是版本功能的增强,有的可能是新功能新特性的增加。比如,在 2022 年的时候发布了 vSAN 8 并推出了全新一代 vSAN Express Storage Architecture(ESA)超融合基础架构,与 vSAN Original Storage Architecture(OSA)架构相比,这种架构可以带来更高的硬件性能、可扩展性以及易用性;而在 2023 年的时候又推出了基于 vSAN ESA 的全新 vSAN Max 分解存储类型,与 vSAN HCI 类型相比,这种使用方式通过将计算和存储资源进行解耦,以充分利用 ESA 架构的各种优势并专注于为各种工作负载远程提供存储资源。有关最近几个 vSAN 版本之间的功能特性变化,如下图所示:
VMware vSAN 通常每隔一段时间会发布一次新版本,通过不断增强 vSAN 安全性能的同时也带来了许多功能创新。最近结束的 VMware Explore 2024 Barcelona 大会上,VMware by Broadcom 再次讨论了有关 vSAN 功能的新计划,下面一起了解一下这些在 vSAN 9 或者 VMware Cloud Foundation 9 中可能带来的新变化。
注意:以下内容仅代表 VMware 未来的计划/愿景,并不保证能够真正推出以及什么时候可以使用,所以请以官方发布的正式通知为主。
1)vSAN Stretched Cluster:Automated Site Maintenance
vSAN 延伸集群环境中,当想对一边“站点”进行维护时,你可能需要将主机逐个置于维护模式,由于管理员需要手动完成这些动作,因此工作量会变得特别大,如果使用基于“站点”级别的维护模式,只需要点击一下,vSAN 会自动执行跨站点 vMotion 工作流并将指定“站点”内的主机进入维护模式;如果完成维护,当点击退出维护模式时,所有已迁移的虚拟机会自动回迁至源站点。其次,如果手动按顺序将主机置于维护模式,这个时候后面要置于维护模式的主机可能就会存在虚拟机更新的副本数据,这样就会导致前后置于维护模式的主机副本数据不一致的风险,当然如果后续正常退出维护模式并再次上线后,这些不一致的数据会重新进行同步,但是如果刚好另外一个站点发生故障,这个时候由于另外一个站点具有最新的副本数据,当本站点内的主机退出维护模式后,前面置于维护模式的主机就不能去同步后面置于维护模式的主机副本数据了,如果使用 vSAN 站点维护,vSAN 会协调维护工作并确保“站点”内的数据保持一致。
2)vSAN Stretched Cluster:Site Takeover
vSAN 延伸集群环境中,当发生严重故障事故时,比如数据站点和见证站点发生同时故障的情况下,这里有两种情形,第一种是如果见证站点是在数据站点故障之后发生故障的,那么这时候 vSAN 会将另外一边站点上的票数拉高并让虚拟机保持可用;第二种是如果见证站点和数据站点“同时”发生故障的情况下,另外一边站点就没法继续让虚拟机继续运行了,HA 会自动将虚拟机关机直到有一边站点或全部站点恢复后,再重新选票并恢复虚拟机的可用。在这种极端情况下,如果还想让任然处于活动站点上面的虚拟机继续运行,这个时候使用 vSAN 站点接管就能解决这个问题,即便虚拟机的对象票数不够的情况下,也可以允许你手动(UI/脚本)通知 vSAN,然后由 HA 协调打开能够恢复运行虚拟机的电源。
3)vSAN Remote Protection
vSAN Data Protection 是在 VMware vSAN 8 U3 引入的基于 vSAN ESA 的新功能,借助 vSAN Data Protection 功能,你可以在 vSAN 本地集群创建虚拟机的原生 vSAN 快照,并快速从操作故障或勒索软件攻击中恢复虚拟机。除此之外,还支持集成使用灾难恢复(DR)解决方案 VMware Live Recovery 中的 VMware Live Cyber Recovery,将本地 vSAN 环境中的虚拟机 vSAN 快照复制到共有云(如 VMware Cloud on AWS)中,根据需要时可以即时恢复本地站点。如果增加 vSAN Remote Protection 功能之后,vSAN Data Protection 功能将与原生的 Replication 功能以及灾难恢复(DR)解决方案 VMware Live Recovery 中的 VMware Live Site Recovery(之前叫 SRM)集成,以支持并完善本地数据中心的远端保护。这些功能将统一由一个 vSAN Data Protection Snapshot Appliance 来实现。
4)vSAN Storage Clusters:Storage Traffic Isolation
VMware vSAN 分解存储环境当中,客户端(vSphere)集群通过远程挂载服务器端(vSAN)集群上的存储,这里之间互联的存储网络可以区分为两个,一个是客户端存储网络(Client Network),另一个是服务器端存储网络(Storage Network)。服务器端由于自身是 vSAN 存储集群,所以这里需要专用的 vSAN 存储网络,由于客户端需要远程挂载服务器端的 vSAN 存储,所以客户端集群与服务器端集群之间的 vSAN 存储网络可以被理解为客户端存储网络,这个客户端存储网络主要由虚拟机产生数据流量。由于服务器端 vSAN 存储网络具有非常高的流量,而客户端集群也同时需要向服务器端的 vSAN 存储进行读写,这样一来就有可能会导致虚拟机存储读写的不稳定。如果进行客户端存储网络和服务器端存储网络的隔离,这样既能保证虚拟机不受服务器端存储流量的影响,也能提高网络安全性。这与 vSAN 延伸集群中将 vSAN 见证流量进行分离的方式类似。
5)Disaggregated Compute & Storage High Availability
如果在 VMware Cloud Foundation 环境中使用了 vSAN 分解存储方式,“服务器端”使用了延伸集群架构的 vSAN HCI 存储类型或 vSAN Max 分解存储类型,当“客户端集群”为 vSAN 计算延伸集群(vSphere Stretched Cluster)时,如果客户端和服务器端任意一边的某一个站点发生故障时,将自动完成计算和存储在数据中心级别的高可用性,最终实现关键应用程序的 0 RPO 以及较低的 RTO。
6)Federated Storage Operations
VMware Cloud Foundation 9 中的联合存储视图,在此视图中能够查看所有站点上的存储分布和健康状况、容量使用情况以及关键警报等。除此之外,针对工作负载域中使用了 vSAN 延伸集群架构的场景,在联合存储视图中支持可视化地图,能够直接清晰明了的看到每个站点的详细信息以及拓扑分布情况。
7)Federated Data Protection
VMware Cloud Foundation 9 中的联合数据保护,针对于 VCF 环境数据保护和恢复的集中主页,比如支持前面所说的 vSAN Remote Protection 功能,你可以在一个地方查看所有受保护的 vCenter 和即时恢复区域,并获得所有区域的重要保护警报通知。
8)Federated Performance Monitoring
VMware Cloud Foundation 9 中的联合性能监控,用于监控 VCF 站点中所有 vSAN 性能的集中式仪表板,一站式排除所有 vSAN 性能故障。由于 VCF 9 中将与 Aria Operations 云管平台合并统一为一个 UI,所以在新的 UI(VCF Operations)中可以直接进行存储相关的监控和故障排除等工作流。
9)Multi-Site Performance Insights
VMware Cloud Foundation 9 中的多站点性能分析,用于对存在存储性能问题的集群进行故障诊断,并主动优化和监控性能。由于 VCF 9 中将与 Aria Operations 云管平台合并统一为一个 UI,所以在新的 UI(VCF Operations)中可以直接进行存储相关的监控和故障排除等工作流。