芯片即王道,微软新DC虚机性能大揭秘
2018-05-04 17:14 WangSong技术点滴 阅读(1272) 评论(0) 编辑 收藏 举报芯片即王道,微软新DC虚机性能大揭秘
本文介绍分为以下几个部分:
l 未开启FPGA,东区同一VNET下,两台VM网络性能和延迟测试
l 开启FPGA,东区同一VNET下,两台VM网络性能和延迟测试
VM都是使用(CentOS-7.4标准 E64_v3 (64 vcpu,432 GB 内存))
一. Background:
根据之前博客介绍,已经测试目前Azure Region上开启FPGA的性能测试,包括相同情况下,是否开启FPGA对CPU利用率的影响,具体可以参考之前的blog链接:http://www.cnblogs.com/wangsongshare/p/8746356.html,因为Azure在北京和上海还有增加两个Region,在新Region下虚拟机的类型也变的更多,新增加了Dv3和Ev3两种使用超线程技术的机器,一些客户想做嵌套虚拟化的可以选用,同时Ev3的最大可以提供64 core,432GB内存, 对于CPU密集型或内存密集型需求的客户业务,提供更多选择,可以支撑SAP等Workload搬上Azure。
新Azure Region在为客户提供了极大的选择做高可用双活架构,可选择的VM也更加广泛,这篇blog为大家测试新Region网络的性能和FPGA对性能的影响。
在此,我们选取E64_v3最大size机器,因为网络带宽性能都跟机器的size有关系,具体可以参考:https://docs.microsoft.com/zh-cn/azure/virtual-machines/linux/sizes-memory,可以看到E64_v3最大网络带宽可以到30Gbps。
本篇采用NTTTCP工具测试吞吐量,qperf测试延迟,因为qperf可以测试精度到微秒级别,所以可以看到开启FPGA对延迟的优化,一般的ping命令,需要通过tcpdump看时间戳进行区分。
NTTTCP安装:https://docs.azure.cn/zh-cn/virtual-network/virtual-network-bandwidth-testing
qperf安装:yum
二. 未开启FPGA,东区同一VNET下,两台VM网络性能测试
1. qperf延迟测试,取了大概的平均值
2. NTTTCP测试带宽吞吐量
三. 开启FPGA,东区两台VM网络性能测试
1. qperf测试延迟
2. NTTTCP测试带宽吞吐量:
四. 总结:同一VNET下 E64v3 Centos7.4测试
Tool |
FPGA Disabled |
FPGA Enabled |
NTTTCP Network |
20.87Gbps |
30.42Gbps |
qperf Latency |
0.142ms |
0.027ms |
1. 吞吐量提升:开启FPGA可以达到官网的标称值30Gbps,比未开启状态吞吐量提高50%,所以针对于大机器可以通过开启FPGA看到吞吐量的差异;
2. 延迟优化:开启FPGA,延迟优化将近5倍,这是一个非常高的提升,这仅仅是测试工具上看到的优化,针对于客户特定的应用场景,还会有更大的提升。