芯片算力计算方案分析

芯片算力计算方案分析
芯片算力公式主要有两个:
1. 计算=(单芯片)性能*规模(即数量)*利用率
2. CPU算力计算公式:Flops=[CPU核数][单核主频][CPU单个周期浮点计算能力]
注意,这两个公式只适用于特定情况,根据实际情况选择合适的公式。
1. 硬件算力计算公式

 以上公式为硬件上限总和,N 即设备数,ECP 即各设备算力。本文中均以64位双精度浮点数的运算来进行衡量。在同构处理器时代,一般使用主频来衡量一个处理器的性能。

而到了异构处理器时代,随着人工智能、大数据、多媒体编解码对海量数据的计算需求,一般使用浮点运算能力FLOPS来衡量一个处理器的性能。
1.1 细化
按算力类型分类进行细化,并且由于超算类算力与其他两类算力量级差距较大,所以在此处暂时将其省略,公式表示为如下:

 1.2 进一步细化

具体到每种不同的芯片,上述公式可写为:

 以上即为不考虑算法及场景下的理想化供给端算力上限计算公式。

以下各设备算力数据均来自维基百科相关页面:
  1. ECP_cpu:目前桌面端及服务器大部分仍采用 X64 架构芯片,其中主要由 Intel和 AMD 两家厂商所提供:
表3-1 部分CPU算力

微架构

FP64

Intel CPU

 

Intel Atom (Bonnell, Saltwell, Silvermont and Goldmont)

2

Intel Ice Lake, Tiger Lake and Rocket Lake

32

AMD CPU

 

AMD Zen 2 (Ryzen 3000 series, Threadripper 3000 series, Epyc Rome))

16

AMD Zen 3 (Ryzen 5000 series)

16

Intel CPU 总平均 9.22;AMD CPU 总平均 6.33
(a) Intel CPU total avg 9.222222222222221
(b) AMD CPU total avg 6.333333333333333
2. ECP_soc: 而移动端 Soc 主要代表就是 ARM 公司设计的高级精简指令集机器(Advanced RISC Machine)
表3-2 部分Soc算力

微架构

FP64

ARM Soc

 

ARM Cortex-A32, A35, A53, A55, A72, A73, A75

2

ARM Cortex-A57

4

ARM Cortex-A76, A77, A78

8

ARM Cortex-X1

16

3. ECP_gpu: Nvidia总平均 0.53;AMD 总平均 0.63
表3-3 部分GPU算力

微架构

FP64

Nvidia GPU

 

Nvidia Volta

1

Nvidia Turing (only GeForce 16XX)

1/16

Nvidia Turing (all except GeForce 16XX)

1/16

Nvidia Ampere (only Tesla A100/A30)

2

AMD GPU

 

AMD GCN Vega 20 (only Radeon Instinct MI50 / MI60 and Radeon Pro VII)

16

AMD CDNA

1

AMD RDNA

1/8

表3-4 芯片按类别平均算力

设备类型

Intel CPU

AMD CPU

ARM Soc

Nvidia GPU

AMD GPU

平均算力(FP64)

9.22

6.33

4.67

0.53

0.63

以上的数据均为 FLOPs, 当设备只拥有一块 CPU 的情况时具体的 FLOPS通过以上公式计算,即浮点性能 (FLOPS) = 总运算核心数 x 每周期运算次数 x 处理器相对运作频率。 

 2. 各类型硬件占比或出货量

2.1 CPU 市场调研
根据 businessquant 网站的 2020 年 5 月发布的统计数据,AMD 的出货量在4 月份再次激增。按绝对值计算,AMD 在 4 月份售出了超过 45,000 片处理器,高于 3 月份的 19000 片。
另一方面,Intel 于 4 月份售出了约 4,300 片处理器,而 3 月份为 2,415 片。这意味着 AMD 和 Intel 在 4 月份的市场份额分别为 91% 和 9%。
以下基于德国零售商 http://mindfactory.de 德国最大的零售商之一)的销售数据。
MindFactory 每个月都会详细统计 AMD 锐龙、Intel 酷睿处理器的销售情况。自从发布 Zen3 架构以来,AMD 几乎完全击败了 Intel,尤其是在收入和平均销售价格方面。
虽然英特尔让步且大幅降价,但 AMD 却反其道而行之,以较为合适的价格开始售卖 Zen3。
这导致 AMD 自 Zen 1 推出以来首次出现,现在销售的 CPU 数量显著高于英特尔,每个 CPU 的平均销售价格也超过了英特尔。AMD 一款型号 5950X 的价格约 900 欧元,它热卖如潮。
2.2 Soc 市场 ARM 销售量:
 
图3-4 包含ARM核心的销售量
2.3 GPU 市场调研
表 3-5 GPU全球市场份额

公司

Q4 2016

Q4 2017

Q4 2018

Q4 2019

Q4 2020

Q1 2021

AMD

29.50%

33.70%

18.80%

31.08%

17.00%

20.00%

Nvidia

70.50%

66.30%

81.20%

68.92%

83.00%

80.00%

由于 DSP,FPGA,ASIC,NPU 的种类繁多且数据较难获取,故算力公式中仅以CPU,Soc,GPU 三类为主;
根据以上调研到的数据,我们可以把上述的算力计算公式除了设备数之外都具体到数值

 表3-6 2020 年至 2022 年全球各类设备出货量

设备类型

2020

2021

2022

总计

传统个人电脑

178279

169891

161672

509842

Ultramoblie(顶级机型)

72529

76789

80036

229354

Ultramoblie(基本型与实用型)

138712

134255

132465

405432

手机

1776779

1771242

1756936

5304957

 

 

 

 

 

Ultramobile(顶级机型)类别包括微软的 Windows 10、Intel x86 产品与苹果的 MacBook Air 等。
Ultramobile(平板及翻盖式)类别包括 iPad、iPad mini、Samsung Galaxy Tab S2、Amazon Fire HD、Lenovo Yoga Tab 3、Acer Iconia One。
Ncpu:Nsoc:Ngpu = 145:100:1120 (i.e. 10.58:7.30:81.76≈11:7:82)。
每 100 个设备里,大约 11 块 CPU, 7 块 GPU, 82 块 Soc。
其中:

 :用户所持有设备的 CPU 数

 :用户所持有设备的 Soc 数

 :用户所持有设备的 GPU 数

表3-7 2020年主要工业产品产量

产品名称

单位

产量

移动通信手持机

万台

146961.8

微型计算机设备

万台

37800.4

 

 在 FLOPS 资料来源的中文页面上,我们可以得到几个具体的典型设备芯片的FLOPS,通过它们来重新构成上述公式

 具体选择的典型代表以当世代最新的主流芯片为主:(但由于中文页面更新频率较低,所以得到的数据时效性也较低)。

表3-8 各类芯片代表的FLOPS

各类芯片代表

GFLOPS

Intel Core i7-10700KF

5470

AMD Ryzen 7 3700X

5460

NVIDIA Tegra X1

512

Nvidia Ampere (only Tesla A100/A30)

7200

AMD Radeon RX 5700 XT

9754

此处仅单纯考虑了理想化的算力计算方式,算力用途以及功耗很多指标并未考虑在内。
cpui 代表 Intel 出产的 CPU,cpua代表 AMD 出产的 CPU; gpun 代表 Nvidia出产的 GPU,gpua 代表 AMD 出产的 GPU
[1] Wikipedia contributors, "FLOPS," Wikipedia, The Free Encyclopedia, https://en.wikipedia.org/w/index.php?title=FLOPS&oldid=1052271908 (accessed October 31, 2021).
[4]Wikipedia contributors, "Arm Ltd.," Wikipedia, The Free Encyclopedia, https://en.wikipedia.org/w/index.php?title=Arm_Ltd.&oldid=1049541238(accessed November 11, 2021).
[6] Gartner, Forecast: PCs, Ultramobiles and Mobile Phones, Worldwide, 2017-2023, 4Q19 Update
posted @ 2024-06-03 04:57  吴建明wujianming  阅读(710)  评论(0编辑  收藏  举报