芯片算力计算方案分析
以上公式为硬件上限总和,N 即设备数,ECP 即各设备算力。本文中均以64位双精度浮点数的运算来进行衡量。在同构处理器时代,一般使用主频来衡量一个处理器的性能。
1.2 进一步细化
以上即为不考虑算法及场景下的理想化供给端算力上限计算公式。
- ECP_cpu:目前桌面端及服务器大部分仍采用 X64 架构芯片,其中主要由 Intel和 AMD 两家厂商所提供:
微架构 |
FP64 |
Intel CPU |
|
Intel Atom (Bonnell, Saltwell, Silvermont and Goldmont) |
2 |
Intel Ice Lake, Tiger Lake and Rocket Lake |
32 |
AMD CPU |
|
AMD Zen 2 (Ryzen 3000 series, Threadripper 3000 series, Epyc Rome)) |
16 |
AMD Zen 3 (Ryzen 5000 series) |
16 |
微架构 |
FP64 |
ARM Soc |
|
ARM Cortex-A32, A35, A53, A55, A72, A73, A75 |
2 |
ARM Cortex-A57 |
4 |
ARM Cortex-A76, A77, A78 |
8 |
ARM Cortex-X1 |
16 |
微架构 |
FP64 |
Nvidia GPU |
|
Nvidia Volta |
1 |
Nvidia Turing (only GeForce 16XX) |
1/16 |
Nvidia Turing (all except GeForce 16XX) |
1/16 |
Nvidia Ampere (only Tesla A100/A30) |
2 |
AMD GPU |
|
AMD GCN Vega 20 (only Radeon Instinct MI50 / MI60 and Radeon Pro VII) |
16 |
AMD CDNA |
1 |
AMD RDNA |
1/8 |
设备类型 |
Intel CPU |
AMD CPU |
ARM Soc |
Nvidia GPU |
AMD GPU |
平均算力(FP64) |
9.22 |
6.33 |
4.67 |
0.53 |
0.63 |
2. 各类型硬件占比或出货量
公司 |
Q4 2016 |
Q4 2017 |
Q4 2018 |
Q4 2019 |
Q4 2020 |
Q1 2021 |
AMD |
29.50% |
33.70% |
18.80% |
31.08% |
17.00% |
20.00% |
Nvidia |
70.50% |
66.30% |
81.20% |
68.92% |
83.00% |
80.00% |
表3-6 2020 年至 2022 年全球各类设备出货量
|
|
|
|
|
:用户所持有设备的 CPU 数
:用户所持有设备的 Soc 数
:用户所持有设备的 GPU 数
产品名称 |
单位 |
产量 |
移动通信手持机 |
万台 |
146961.8 |
微型计算机设备 |
万台 |
37800.4 |
在 FLOPS 资料来源的中文页面上,我们可以得到几个具体的典型设备芯片的FLOPS,通过它们来重新构成上述公式
具体选择的典型代表以当世代最新的主流芯片为主:(但由于中文页面更新频率较低,所以得到的数据时效性也较低)。
各类芯片代表 |
GFLOPS |
Intel Core i7-10700KF |
5470 |
AMD Ryzen 7 3700X |
5460 |
NVIDIA Tegra X1 |
512 |
Nvidia Ampere (only Tesla A100/A30) |
7200 |
AMD Radeon RX 5700 XT |
9754 |