云数据中心网络架构分析及其关键技术
Cloud Data Center Network Architecture Analysis and Its Key Technologies
Abstract The swift progress of cloud computing technology has led to the emergence of cloud data centers as essential infrastructure for processing, storing, and transmitting big data.In order to ensure the performance and stability of cloud services, the efficiency and scalability of cloud data center network architecture are crucial. This article provides a comprehensive analysis of the network architecture and key technologies of cloud data centers. Firstly, we discuss the evolution of data center networks, from traditional three-tier structures to the latest large-scale data center network architectures. Then, we introduce the main network architecture designs, including those based on Fat-Tree, Clos, and BCube topology structures. We also explore network virtualization technology and its optimization methods, such as SDN, NFV, and VXLAN. Finally, we look at future trends in cloud data center network development, including higher bandwidth, lower latency, improved security, and greater reliability. Additionally, we propose some potential future research directions, such as network adaptation, network data analysis, and optimization.
Key word cloud data center; network architecture; network virtualization; scalability
摘要 随着云计算技术的快速发展,云数据中心已成为大数据处理、存储和传输的核心基础设施。为确保云服务的性能和稳定性,云数据中心网络架构的高效性和可扩展性至关重要。本文全面分析了云数据中心网络架构及其关键技术。首先,探讨了数据中心网络的演进,从传统三层结构到最新的超大规模数据中心网络架构。然后,介绍了主要的网络架构设计,包括基于Fat-Tree、Clos和BCube等拓扑结构的设计。同时,探讨了网络虚拟化技术及其优化方法,如SDN、NFV和VXLAN等。然后,展望了未来云数据中心网络的发展趋势,包括更高的带宽、更低的延迟、更好的安全性和更高的可靠性等方面。最后,提出了一些未来可能的研究方向和发展方向。
关键词 云数据中心;网络架构;网络虚拟化;可扩展性
云计算是一种基于网络的计算模型,它按需提供基础设施即服务(IaaS)、平台即服务(PaaS)和软件即服务(SaaS)等服务[1]。自移动云计算出现以来,互联网上的数据量急剧增加。网络中心架构(Data Center Network,DCN)作为数据中心和云计算的基础硬件设施,已成为近年来研究热点。本文将介绍主要的云数据中心网络架构、网络虚拟化技术、网络性能优化和未来发展趋势。
1. 云数据中心网络架构
云数据中心网络架构经历了从传统的层次结构到现代的扁平化结构的变革。初始阶段的数据中心网络架构主要包括三层结构:访问层、汇聚层和核心层[2]。随着云数据中心规模的扩大和业务需求的增加,三层结构逐渐暴露出可扩展性和性能瓶颈。为了解决这些问题,研究者提出了多种新型的网络架构,如Fat-Tree、Clos网络、DCell和BCube等。
1.1 Fat-Tree
Fat-Tree是一种常用于构建数据中心网络的拓扑结构[3]。它由微软研究院提出,旨在解决数据中心网络带宽不足、可靠性低、成本高等问题。Fat-Tree采用三层结构,包括边层、聚合层和核心层。其中,每个交换机有k个端口,可以连接到k条链路上。
在Fat-Tree中,边层交换机直接与终端设备相连,负责转发数据包。聚合层交换机汇集多个边层交换机的流量,并将其发送到核心层。核心层交换机则汇总所有流量,负责网络中的最终路由。这种设计使得Fat-Tree具有很好的可扩展性和容错性。在Fat-Tree中,交换机之间的链路被分为两类:向上链路和向下链路。向上链路是指从边层交换机连接到聚合层交换机的链路,而向下链路则是指从聚合层交换机连接到边层交换机的链路。这种设计使得数据流量可以更加灵活地在不同层次的网络结构之间传输。
另外,在Fat-Tree中,每个交换机都有多个出口和入口,形成了多条通路,能够支持高吞吐量的数据传输。通过将交换机和链路进行复制和并联,我们可以很容易地将Fat-Tree扩展到大规模的数据中心网络中。
Fat-Tree的另一个优点是其带宽利用率高。每个交换机都有多个出口,在整个网络中形成了多条通路,能够支持高吞吐量的数据传输。同时,Fat-Tree的结构简单明了,易于管理和维护。
然而,Fat-Tree也存在一些挑战。首先,由于每个交换机都需要连接多条链路,所以网络的建设成本比较高。此外,在实际应用中,Fat-Tree的性能受到了数据中心应用负载和带宽分配策略的影响。
图1 Fat-Tree 架构的拓扑示例
Fig.1 A sample topology of fat-tree architecture
为了解决这些问题,研究人员提出了一些改进型的Fat-Tree结构。例如,Jellyfish结构[4]可以根据实际应用负载自适应地调整网络拓扑,从而提高性能和资源利用率。PASTA结构[5]则通过优化链路的利用率和缩小每个交换机的缓存大小来降低成本。
1.2 Clos网络
Clos网络,也被称作三层数据中心网络,是一种常见的数据中心网络拓扑结构[6]。它由三个层级组成:核心层、聚合层和访问层,每个层级都有不同的功能和特点。
核心层是Clos网络的顶层,主要负责数据中心内部不同区域之间的高速互联,保证了数据传输的高效性和可靠性。核心层通常采用高速路由器或交换机,并且可以进行冗余设计以提高网络的可靠性。在Clos网络中,核心层的主要任务是将不同聚合层间的流量汇聚到一起,然后再分发到相应的访问层。
聚合层位于核心层和访问层之间,其主要任务是处理来自访问层的流量,并将其转发到核心层。聚合层通常包含多个交换机或路由器,可以通过端口聚合技术提供更高的带宽和吞吐量,并且支持多路径冗余设计以提高可靠性。如果访问层的设备需要与其他数据中心进行通信,则可以通过聚合层进行转发。
访问层是Clos网络的底层,负责连接数据中心内的服务器和终端用户设备。访问层通常包含多个交换机或路由器,并且可以使用冗余设计以提高可靠性和容错能力。在Clos网络中,访问层的主要任务是将数据传输到聚合层或核心层,并将返回流量发送回相应的服务器或终端用户设备。
1.3 DCell
DCell是一种层次化的数据中心网络结构[7],由一系列节点和这些节点之间相互连接的链路构成。每个节点都具有唯一的标识符,称为节点ID,而每条链路也具有唯一的标识符,称为端口号。DCell的节点可视为虚拟交换机,每个交换机上连接着多个主机。
DCell的分层结构使得网络能够轻松扩展并适应不断变化的负载。由于每个节点连接了多个其他节点,DCell可以提供非常低的延迟和高吞吐量。然而,DCell的设计、部署和管理都比较复杂,且开销可能会比其他网络架构更高。
DCell可以提供更低的延迟和更高的吞吐量,以及更好的负载平衡和容错能力,这使得它在处理大型分布式系统时具有重要作用。例如,在一个具有1,000个节点的情况下,DCell的平均延迟约为0.5毫秒,而传统的数据中心架构的平均延迟约为2毫秒[8]。因此,DCell是一种值得研究和探索的新型数据中心网络架构。
1.4 BCube
BCube是一种数据中心网络架构,它由MIT的研究人员提出[9],采用了一个大立方体的拓扑结构,并将服务器和交换机配置成同样数量的节点。每个节点都包含一个处理器、内存和网络适配器,因此可以在任何时候作为服务器或交换机使用。BCube网络架构具有许多优点,如高可用性、低延迟、可扩展性和负载均衡。其中,高度的冗余性可以保证即使其中某些节点发生故障,整个网络仍能够运行;所有节点之间距离相等,因此可以实现非常低的延迟;由于BCube网络架构具有模块化结构,因此可以轻松地扩展到更大规模的网络环境中;由于BCube网络架构中的所有节点都是对等的,因此可以实现负载均衡,从而提高网络的吞吐量。然而,BCube网络架构也存在一些缺点,如成本昂贵、管理复杂和数据中心特定等[10]。
2. 网络虚拟化技术及其优化方法
网络虚拟化技术是一种将物理网络资源虚拟化为多个逻辑网络的技术,它可以提高网络资源的利用率和灵活性,并且可以降低网络部署和运维成本。近年来,SDN(软件定义网络)、NFV(网络功能虚拟化)和VXLAN(虚拟化扩展局域网)等技术在网络虚拟化领域取得了显著的发展。
2.1 SDN
软件定义网络(SDN,Software-Defined Networking)是一种创新的网络架构[11],它通过将网络控制平面与网络数据平面进行分离,实现了对网络设备的集中管理和编程。SDN技术旨在提高网络的可编程性、可扩展性、灵活性和自动化程度,从而更好地满足不断变化的应用程序需求和云计算环境中的挑战。
SDN架构主要包括以下三个层次:
应用层:应用层包括各种网络应用,例如流量工程、安全策略、负载均衡和网络虚拟化。这些应用通过标准化的API(应用程序编程接口)与控制层进行交互,以便实现对网络资源的动态配置和管理。
控制层:控制层是SDN架构的核心,它包括一个或多个SDN控制器,负责管理网络设备(如交换机和路由器)的配置和状态。SDN控制器通过南向接口(例如OpenFlow协议)与数据层设备进行通信,从而实现对网络拓扑、路由策略和流表的集中管理。此外,SDN控制器还可以根据应用层的需求,动态地调整网络资源分配和优化网络性能。
数据层:数据层由各种网络设备(如交换机、路由器和防火墙)组成,负责实际执行数据包的转发和处理。在SDN架构中,数据层设备主要负责实现控制层下发的路由策略和流表规则,从而确保数据包按照预定的路径进行传输。
2.2 NFV
网络功能虚拟化(NFV)[12]是一种新的网络架构技术。它利用通用硬件平台和虚拟化技术,通过软件来实现网络设备的功能,如路由器、防火墙和网管等,从而实现网络功能的快速部署、灵活扩展和降低运维成本。
NFV技术将网络设备分成控制面和数据面。控制面采用软件实现,数据面可以软件实现也可以硬件加速。两者通过标准接口相连。基于NFV,网络功能可以像软件一样定义、开发和部署。NFV系统本身也是一个可编程平台,可以实现网络功能的自动化部署、配置、连接、监控和管理。
NFV增加了运营商网络的灵活性和运维效率,但也带来挑战,如性能损失、管理复杂度上升和安全隐患增加等。未来NFV技术还需要不断发展来应对这些挑战,并充分发挥其优势。
NFV通过软件和IT技术重构网络架构,提高资源使用率和网络灵活性,使网络功能变得更加敏捷、弹性和经济。它是未来网络发展的一个重要趋势。NFV为运营商带来更灵活、可扩展和节约成本的网络,为用户带来更丰富多样的网络服务。
2.3 VXLAN
VXLAN(虚拟化扩展局域网)[13]是一种网络虚拟化技术,它在核心网上扩展广播域,实现局域网的逻辑隔离。主要特征有:
1. 隧道封装。VXLAN使用UDP封装机制,将原始的Ethernet帧封装在UDP段中,形成VXLAN数据包。VXLAN数据包可以路由,从而扩展局域网。
2. 逻辑隔离。VXLAN使用24位的VXLAN网络标识(VNI)来对虚拟子网进行区分和隔离。VNI允许最多16M个虚拟子网,从而实现网段扩展和广播域隔离。
3. 宿主映射。VXLAN使用群组开始会话宿主映射协议,将数据包发送到正确的宿主。发送端设备学习远端设备的IP-VNI-MAC映射关系,并记录在映射表中。
4. ARP增强。由于VXLAN数据包是在IP网络中传输的,因此需要解决虚拟子网内的ARP问题。VXLAN使用代理ARP服务来响应ARP请求,或直接将ARP放在VXLAN报头中进行广播。
5. 兼容现有设备。VXLAN可以部署在现有的IP网络基础设施上,与传统的网络设备兼容,从而降低部署门槛。
VXLAN技术在数据中心吞吐量大、实施虚拟化的环境下发挥重要作用。它扩展了VLAN的范围,实现更大规模的多租户网络架构,为云计算和网络功能虚拟化技术提供了重要支持。但是,VXLAN也增加了配置和管理的复杂度,并可能影响网络性能。
3. 未来云数据中心网络的发展趋势
未来云数据中心网络的发展趋势体现在以下:虚拟化网络技术的发展与竞争将会继续,支持更大规模的虚拟子网。VXLAN、NVGRE等技术会越来越丰富,支持更多租户和更大网段规模,形成更激烈的竞争。二层虚拟化网络技术也将出现。 网络节能技术发展迅速。光纤通道(FCoE)[14]等技术会扩展支持,实现更高效、更环保的网络设备和交换技术。SDN控制器与NFV管理框架会进一步融合,形成统一的SDN/NFV管理平台,支持弹性配置和微调网络资源。NFVI平台也会出现。新一代更为智能的交换机替换传统交换机,支持programmable交换、学习自动化、流表扩展等功能,提供更大规模和更高灵活性。
未来云数据中心网络将聚焦虚拟化、节能、灵活性和自动化,提供更高规模、性能及成本效益的网络架构,支持云计算、边缘计算[15]和NFV的发展。虚拟化技术竞争会激烈,网络将更加节能、可观测和可管理。容器与边缘场景也会驱动相关技术进步, cloud native 网络将更加深入。未来网络将更加软件定义、自动化,以支持IT的快速发展。
4.结语
面对云计算和大数据等业务应用范围日益扩大的趋势, 要转变原有的云数据中心网络架构模式, 引入 SPBM、VXLAN 和 SDN 关键技术, 以满足云数据中心大规模部署的要求, 有效实现云网融合。随着云数据中心网络架构的集成化、虚拟化趋势日益明显, 为了提高云数据中心网络的利用率, 要采用 SPBM、VXLAN 和 SDN 关键技术不断提高云数据中心网络的性能和服务质量。
参考文献
[1] Shuja J, Gani A, Shamshirband S, et al. Sustainable cloud data centers: a survey of enabling techniques and technologies[J]. Renewable and Sustainable Energy Reviews, 2016, 62: 195-214.
[2] Wang B, Qi Z, Ma R, et al. A survey on data center networking for cloud computing[J]. Computer Networks, 2015, 91: 528-547.
[3] Jain N, Bhatele A, Howell L H, et al. Predicting the performance impact of different fat-tree configurations[C]//Proceedings of the International Conference for High Performance Computing, Networking, Storage and Analysis. 2017: 1-13.
[4] ALzaid Z, Bhowmik S, Yuan X. Multi-path routing in the jellyfish network[C]//2021 IEEE International Parallel and Distributed Processing Symposium Workshops (IPDPSW). IEEE, 2021: 832-841.
[5] Servilla M, Brunt J, Costa D, et al. The contribution and reuse of LTER data in the Provenance Aware Synthesis Tracking Architecture (PASTA) data repository[J]. Ecological Informatics, 2016, 36: 247-258.
[6] Sehery W, Clancy C. Flow optimization in data centers with clos networks in support of cloud applications[J]. IEEE Transactions on Network and Service Management, 2017, 14(4): 847-859.
[7] Castillo A C. A Comprehensive DCell Network Topology Model for a Data Center[C]//2021 International Conference on Innovative Computing (ICIC). IEEE, 2021: 1-6.
[8] Couto R D S, Secci S, Campista M E M, et al. Reliability and survivability analysis of data center network topologies[J]. Journal of Network and Systems Management, 2016, 24: 346-392.
[9] Lv M, Fan J, Fan W, et al. Fault diagnosis based on subsystem structures of data center network BCube[J]. IEEE Transactions on Reliability, 2022, 71(2): 963-972.
[10] Zeng Z, Shen H. Light-BCube: A Scalable and High Performance Network Structure for Modular Data Center[C]//Proceedings of the 7th International Conference on Big Data and Computing. 2022: 20-28.
[11] Shirmarz A, Ghaffari A. Performance issues and solutions in SDN-based data center: a survey[J]. The Journal of Supercomputing, 2020, 76(10): 7545-7593.
[12] Souza R, Dias K, Fernandes S. NFV data centers: A systematic review[J]. IEEE Access, 2020, 8: 51713-51735.
[13] Pu H, Wang Y, An X. Safety Protection Design of Virtual Machine Drift Flow in Cloud Data Center Based on VXLAN Technology[J]. Journal of Computer and Communications, 2020, 8(8): 45-58.
[14] Liu J. Cloud Data Center Network Construction Based on Virtualization Technology[C]//Journal of Physics: Conference Series. IOP Publishing, 2021, 1744(3): 032130.
[15] Hassan N, Yau K L A, Wu C. Edge computing in 5G: A review[J]. IEEE Access, 2019, 7: 127276-127289.