AMD EPYC 7003 系列 CPU
已经过去五年了,AMD 通过发布基于全新 Zen 架构的第一代 Epyc CPU,重新点燃了服务器和数据中心的雄心。自那时以来,Epyc 已经在服务器处理器市场份额中取得了显著的进展,蚕食了英特尔的市场份额。
最初的 Epyc,代号为 Naples,被正式命名为 7001 系列,最高可达 32 个核心和 64 个线程。2019 年,AMD 宣布了 Epyc 7002 系列,代号为 Rome,不仅将旗舰 CPU 的核心和线程数量加倍,还通过使用更精细的 Zen 2 架构进一步提高了性能。2021 年,AMD 推出了 Epyc 7003 系列,代号为 Milan,在高端产品中保持了 64 个核心和 128 个线程的处理能力,但通过使用最新的 Zen 3 架构和平台改进,进一步提高了性能。
与桌面芯片一样,AMD 故意保持了前三代产品在同一个插槽(SP3)和平台上,使得旧的主板可以通过简单的 BIOS 更新升级到第三代处理器。五年以上的平台寿命仍然是 Epyc 的一个重要卖点,为数据中心架构师提供了未来的升级路线图。
Epyc 7003 系列将是最后一代使用 SP3 插槽的产品。AMD 已经明确表示,将在新的 SP5 插槽上发布下一代 Epyc 7004 系列,使得未来的芯片与当前的所有模型不兼容。变化不仅仅是插槽的更换,未来的处理器(代号为 Genoa)将采用 DDR5 内存、更多的内存通道、更多的核心、更多的缓存和更高的性能。注意到这个趋势了吗?
AMD 的路线图执行与英特尔形成鲜明对比,后者由于制造延迟而推迟了服务器微架构的发布。当然,英特尔仍然占据着超过 80% 的 x86 服务器 CPU 出货量,但路线图不一致的缺点却成为了 AMD 的幸运之事。
Epyc 7003系列的详细介绍
在探讨Epyc 7003系列的性能参数之前,我们需要更详细地了解Epyc各个世代之间的关键变化。
图表显示,Epyc 7002和7003之间的性能提升比第一代和第二代之间的差异要小。这是可以预期的,特别是当下一代芯片颠覆了上述连续性时。
从Zen 2到Zen 3的转变可以带来20%的性能提升,当使用相同核心和线程数量的芯片进行评估时。具体的改进取决于Zen 3如何运行特定的工作负载,极端情况下甚至可以达到50%的性能提升。然而,20%是普遍的回报。大部分的性能提升来自于对Zen架构的各种方面的改进,包括使用更深的缓冲区、增强的分支预测和更宽的调度机制。这些小的变化汇集成为了对时间就是金钱的行业的有意义的改进。
另一个驱动性能提升的因素是AMD对芯片缓存分区的重新架构。在Zen 2中,每个核心都有访问16MB的L3缓存的权限,两个复合体(CCX)组成一个单独的CCD。Zen 3没有改变CCD中的核心数量(仍然是八个),但取消了CCX。结果是每个核心都可以访问32MB的缓存,这可能会降低虚拟化等缓存密集型应用程序的延迟。这是一个细致的变化,是对工作负载模拟的直接结果。
尽管大部分性能都是通过运行八通道DDR4内存来实现的,但AMD表示,它已经响应了客户的需求,在Epyc 7003系列上运行六通道内存——这是在Epyc 7002上没有的功能。出于多机架安装的成本节约考虑,我们认为这是一个明智的举措,就像引入安全嵌套分页(Secure Nested Paging)一样。
Epyc 7003系列型号
型号 | 核心数/线程数 | TDP | L3缓存 | 基础频率 | 加速频率 | 发布时MSRP |
---|---|---|---|---|---|---|
Epyc 7773X | 64/128 | 280W | 768MB | 2.20GHz | 3.50GHz | $8,800 |
Epyc 7763 | 64/128 | 280W | 256MB | 2.45GHz | 3.40GHz | $7,890 |
Epyc 7713 | 64/128 | 225W | 256MB | 2.00GHz | 3.67GHz | $7,060 |
Epyc 7713P | 64/128 | 225W | 256MB | 2.00GHz | 3.67GHz | $5,010 |
Epyc 7663 | 56/112 | 240W | 256MB | 2.00GHz | 3.50GHz | $6,366 |
Epyc 7643 | 48/96 | 225W | 256MB | 2.30GHz | 3.60GHz | $4,995 |
Epyc 7573X | 32/64 | 280W | 768MB | 2.80GHz | 3.60GHz | $5,590 |
Epyc 75F3 | 32/64 | 280W | 256MB | 2.95GHz | 4.00GHz | $4,860 |
Epyc 7543 | 32/64 | 225W | 256MB | 2.80GHz | 3.70GHz | $3,761 |
Epyc 7543P | 32/64 | 225W | 256MB | 2.80GHz | 3.70GHz | $2,730 |
Epyc 7513 | 32/12 | 200W | 128MB | 2.60GHz | 3.65GHz | $2,840 |
Epyc 7453 | 28/56 | 225W | 64MB | 2.75GHz | 3.45GHz | $1,570 |
Epyc 7473X | 24/48 | 240W | 768MB | 2.80GHz | 3.70GHz | $3,900 |
Epyc 74F3 | 24/48 | 240W | 256MB | 3.20GHz | 4.20GHz | $2,900 |
Epyc 7443 | 24/48 | 200W | 128MB | 2.85GHz | 4.00GHz | $2,010 |
Epyc 7443P | 24/48 | 200W | 128MB | 2.85GHz | 4.00GHz | $1,337 |
Epyc 7413 | 24/48 | 180W | 128MB | 2.65GHz | 3.60GHz | $1,825 |
Epyc 7373X | 16/32 | 240W | 768MB | 3.05GHz | 3.80GHz | $4,185 |
Epyc 73F3 | 16/32 | 240W | 256MB | 3.50GHz | 4.00GHz | $3,521 |
Epyc 7343 | 16/32 | 190W | 128MB | 3.20GHz | 3.90GHz | $1,565 |
Epyc 7313 | 16/32 | 155W | 128MB | 3.00GHz | 3.70GHz | $1,083 |
Epyc 7313P | 16/32 | 155W | 128MB | 3.00GHz | 3.70GHz | $913 |
Epyc 72F3 | 8/16 | 180W | 256MB | 3.70GHz | 4.10GHz | $2,468 |
这些是AMD Epyc 7003系列的各种型号,包括它们的核心数、线程数、TDP、L3缓存、基础频率、加速频率和发布时的MSRP(建议零售价)。
这些型号可以分为几类:
- X系列:这些型号具有更高的频率和更大的L3缓存,例如Epyc 7773X、Epyc 7573X和Epyc 7373X。
- F系列:这些型号具有更高的频率和更小的L3缓存,例如Epyc 75F3、Epyc 74F3和Epyc 73F3。
- P系列:这些型号具有相同的规格,但仅适用于单处理器配置,例如Epyc 7713P、Epyc 7543P和Epyc 7313P。
这些型号的价格从913美元(Epyc 7313P)到8,800美元(Epyc 7773X)不等,取决于它们的规格和性能。
Epyc 7003系列的完整23个CPU产品线。由于AMD使用了模块化的设计方法,通过Infinity Fabric将CCD(核心复合体)连接在一起,因此可以创建出几乎无穷无尽的核心、TDP(功耗)、缓存和频率组合。AMD充分利用了这一点,推出了针对特定环境的优化SKU(产品型号)。
最明显的例子是Epyc 72F3,它使用了与顶级7773X相同的8-CCD布局,但每个CCD中只有一个核心处于活动状态,而7773X可以同时运行所有八个核心。想想看,72F3的核心每个有32MB的L3缓存,而7453(28个核心和64MB缓存)则有2.29MB的L3缓存每个核心。这种组合看起来很奇怪吧?
四个Epyc芯片具有相同的规格,但带有一个P后缀,这意味着它们只能作为单个处理器使用。其他芯片可以在主板上安装成对,称为2P配置,因此需要支付溢价。
细心的读者会注意到四个带有X后缀的芯片,这些芯片被称为Milan-X,它们的L3缓存是普通Epyc 7003处理器的三倍。AMD使用了一种称为“3D V-Cache”的缓存堆叠技术,我们已经详细介绍过了。
扩大的L3缓存对于各种技术计算工作负载非常有用,这些工作负载往往需要大量的内存,根据内部测试。这样做可以显著提高某些需要大量缓存的应用程序的性能,但如果工作负载是计算密集型而不是缓存密集型,那么这种方法就变得毫无意义了。因此,需要谨慎选择。
请注意,相同核心的处理器的建议价格差异很大。例如,16C32T Epyc 7313P的价格仅为913美元,而Epyc 7373X的价格为4185美元,或者说是前者的四倍以上。很明显,AMD为更多的缓存收取了高额的溢价,因为它知道依赖缓存的客户可以支付得起;财务支出远远超过了特定工作负载的性能提高。
同样,核心、功耗预算和缓存的组合决定了目标工作负载。AMD认为可以收取更多的费用时,它就会这样做,特别是如果英特尔Xeon在该领域不是一个真正的竞争对手。例如,如果用户需要高频率的处理器,因为他们的工作负载是突发性的,那么F系列就是为他们准备的……并且价格也相应地高。
AMD的Epyc 7003 SKU矩阵在每个处理器的背景下看起来很混乱。
这个基准测试很有趣。以前需要几分钟的时间,现在在标准的“defconfig”设置下,只需要不到20秒钟。
(注:这里的“defconfig”是指Linux内核的默认配置设置)