GPU-苹果-芯华章FPGA验证分析
GPU-苹果-芯华章FPGA验证分析
参考文献链接
https://mp.weixin.qq.com/s/V1fSBAseLDbkdWUuvFyrmA
https://www.cnblogs.com/timlly/p/11471507.html
https://mp.weixin.qq.com/s/sPky_-EoW4K-RjGuZ_2t8g
https://mp.weixin.qq.com/s/bOF4lTShkyVCLag1WTufPg
深入GPU硬件架构及运行机制
- 一、导言
- 1.1 为何要了解GPU?
- 1.2 内容要点
- 1.3 带着问题阅读
- 二、GPU概述
- 2.1 GPU是什么?
- 2.2 GPU历史
- 2.2.1 NV GPU发展史
- 2.2.2 NV GPU架构发展史
- 2.3 GPU的功能
- 三、GPU物理架构
- 3.1 GPU宏观物理结构
- 3.2 GPU微观物理结构
- 3.2.1 NVidia Tesla架构
- 3.2.2 NVidia Fermi架构
- 3.2.3 NVidia Maxwell架构
- 3.2.4 NVidia Kepler架构
- 3.2.5 NVidia Turing架构
- 3.3 GPU架构的共性
- 四、GPU运行机制
- 4.1 GPU渲染总览
- 4.2 GPU逻辑管线
- 4.3 GPU技术要点
- 4.3.1 SIMD和SIMT
- 4.3.2 co-issue
- 4.3.3 if - else语句
- 4.3.4 Early-Z
- 4.3.5 统一着色器架构(Unified shader Architecture)
- 4.3.6 像素块(Pixel Quad)
- 4.4 GPU资源机制
- 4.4.1 内存架构
- 4.4.2 GPU Context和延迟
- 4.4.3 CPU-GPU异构系统
- 4.4.4 GPU资源管理模型
- 4.4.5 CPU-GPU数据流
- 4.4.6 显像机制
- 4.5 Shader运行机制
- 4.6 利用扩展例证
- 五、总结
- 5.1 CPU vs GPU
- 5.2 渲染优化建议
- 5.3 GPU的未来
- 5.4 结语
- 参考文献
- 特别说明
一、导言
对于大多数图形渲染开发者,GPU是既熟悉又陌生的部件,熟悉的是每天都需要跟它打交道,陌生的是GPU就如一个黑盒,不知道其内部硬件架构,更无从谈及其运行机制。本文以NVIDIA作为主线,将试图全面且深入地剖析GPU的硬件架构及运行机制,主要涉及PC桌面级的GPU,不会覆盖移动端、专业计算、图形工作站级别的GPU。
下载链接:NVIDIA GPU架构白皮书1、NVIDIA A100 Tensor Core GPU技术白皮书2、NVIDIA Kepler GK110-GK210架构白皮书3、NVIDIA Kepler GK110-GK210架构白皮书4、NVIDIA Kepler GK110架构白皮书5、NVIDIA Tesla P100技术白皮书6、NVIDIA Tesla V100 GPU架构白皮书7、英伟达Turing GPU 架构白皮书
GPU技术专题下载链接《GPU高性能计算概述》 《GPU深度学习基础介绍》 《OpenACC基本介绍》 《CUDA CC 编程介绍》 《CUDA Fortr基本介绍》深度报告:GPU研究框架CPU和GPU研究框架合集
1.1 为何要了解GPU?
了解GPU硬件架构和理解运行机制,好处多多,总结出来有:
- 理解GPU其物理结构和运行机制,GPU由黑盒变白盒。
- 更易找出渲染瓶颈,写出高效率shader代码。
- 紧跟时代潮流,了解最前沿渲染技术!
- 技多不压身!
1.2 内容要点
本文的内容要点提炼如下:
- GPU简介、历史、特性。
- GPU硬件架构。
- GPU和CPU的协调调度机制。
- GPU缓存结构。
- GPU渲染管线。
- GPU运行机制。
- GPU优化技巧。
1.3 带着问题阅读
适当带着问题去阅读技术文章,通常能加深理解和记忆,阅读本文可带着以下问题:
1、GPU是如何与CPU协调工作的?
2、GPU也有缓存机制吗?有几层?它们的速度差异多少?
3、GPU的渲染流程有哪些阶段?它们的功能分别是什么?
4、Early-Z技术是什么?发生在哪个阶段?这个阶段还会发生什么?会产生什么问题?如何解决?
5、SIMD和SIMT是什么?它们的好处是什么?co-issue呢?
6、GPU是并行处理的么?若是,硬件层是如何设计和实现的?
7、GPC、TPC、SM是什么?Warp又是什么?它们和Core、Thread之间的关系如何?
8、顶点着色器(VS)和像素着色器(PS)可以是同一处理单元吗?为什么?
9、像素着色器(PS)的最小处理单位是1像素吗?为什么?会带来什么影响?
10、Shader中的if、for等语句会降低渲染效率吗?为什么?
11、如下图,渲染相同面积的图形,三角形数量少(左)的还是数量多(右)的效率更快?为什么?
12、GPU Context是什么?有什么作用?
13、造成渲染瓶颈的问题很可能有哪些?该如何避免或优化它们?
二、GPU概述
2.1 GPU是什么?
GPU全称是Graphics Processing Unit,图形处理单元。它的功能最初与名字一致,是专门用于绘制图像和处理图元数据的特定芯片,后来渐渐加入了其它很多功能。
NVIDIA GPU芯片实物图。我们日常讨论GPU和显卡时,经常混为一谈,严格来说是有所区别的。GPU是显卡(Video card、Display card、Graphics card)最核心的部件,但除了GPU,显卡还有扇热器、通讯元件、与主板和显示器连接的各类插槽。对于PC桌面,生产GPU的厂商主要有两家:NVIDIA:英伟达,是当今首屈一指的图形渲染技术的引领者和GPU生产商佼佼者。NVIDIA的产品俗称N卡,代表产品有GeForce系列、GTX系列、RTX系列等。AMD:既是CPU生产商,也是GPU生产商,它家的显卡俗称A卡。代表产品有Radeon系列。当然,NVIDIA和AMD也都生产移动端、图形工作站类型的GPU。此外,生产移动端显卡的厂商还有ARM、Imagination Technology、高通等公司。
2.2 GPU历史
GPU自从上世纪90年代出现雏形以来,经过20多年的发展,已经发展成不仅仅是渲染图形这么简单,还包含了数学计算、物理模拟、AI运算等功能。
2.2.1 NV GPU发展史
以下是GPU发展节点表:1995 – NV1NV1的渲染画面及其特性。1997 – Riva 128 (NV3), DX31998 – Riva TNT (NV4), DX5
- 32位颜色, 24位Z缓存, 8位模板缓存
- 双纹理, 双线性过滤
- 每时钟2像素 (2 ppc)
1999 - GeForce 256(NV10)固定管线,支持DirectX 7.0硬件T&L(Transform & lighting,坐标变换和光照)
- 立方体环境图(Cubemaps)
- DOT3 – bump mapping
- 2倍各向异性过滤
- 三线性过滤
- DXT纹理压缩
- 4ppc
- 引入“GPU”术语2001 - GeForce 3NV20的渲染画面及其特性。
- 顶点着色器
- 像素着色器
- DirectX 8.0
- Shader Model 1.0
- 可编程渲染管线
- 3D纹理
- 硬件阴影图
- 8倍各向异性过滤
- 多采样抗锯齿(MSAA)
- 4 ppc
2003 - GeForce FX系列(NV3x) -
HLSL
-
- CGSL
- GLSL
- 256顶点操作指令
- 512像素操作指令
- 256顶点操作指令
- 32纹理 + 64算术像素操作指令
- DirectX 9.0
- Shader Model 2.0
- Shader Model 2.0a
- 着色语言
NV30的渲染画面及其特性。
2004 - GeForce 6系列 (NV4x)
- 64位渲染纹理(Render Target)
- FP16*4 纹理过滤和混合
- 分支、循环、声明等
- DirectX 9.0c
- Shader Model 3.0
- 动态流控制
- 顶点纹理读取
- 高动态范围(HDR)
NV40的渲染画面及其特性。
- 2006 - GeForce 8系列 (G8x)NV G80的渲染画面及其特性。
- 几何着色器(Geometry Shaders)
- 没有上限位(No caps bits)
- 统一的着色器(Unified Shaders)
- DirectX 10.0
- Shader Model 4.0
- Vista系统全新驱动
- 基于GPU计算的CUDA问世
- GPU计算能力以GFLOPS计量。
- 2010 - GeForce 405(GF119)
- 更多指令、存储单元、寄存器
- 面向对象着色语言
- 曲面细分
- 计算着色器
- 曲面细分(Tessellation)
- 计算着色器(Compute Shader)
- 外壳着色器(Hull Shader)
- 镶嵌单元(tessellator)
- 域着色器(Domain Shader)
- 支持Stream Output
- 多线程支持
- 改进的纹理压缩
- DirectX 11.0DirectX 11的渲染管线。
- Shader Model 5.0
- 2014 - GeForceGT 710(GK208)
- 轻量化驱动层
- 硬件级多线程渲染支持
- DirectX 12.0
- 更完善的硬件资源管理
- 2016 - GeForceGTX 1060 6GB支持RTX光线追踪的显卡列表。
- 首次支持RTX和DXR技术,即支持光线追踪
- 引入RT Core(光线追踪核心)
- 2018 - TITAN RTX(TU102)
- DirectX 12.1,OpenGL 4.5
- 6GPC,36TPC,72SM,72RT Core,...
- 8K分辨率,1770MHz主频,24G显存,384位带宽
从上面可以看出来,GPU硬件是伴随着图形API标准、游戏一起发展的,并且它们形成了相互相成、相互促进的良性关系。
2.2.2 NV GPU架构发展史
众所周知,CPU的发展符合摩尔定律:每18个月速度翻倍。处理芯片晶体管数量符合摩尔定律,图右是摩尔本人,Intel的创始人而NVIDIA创始人黄仁勋在很多年前曾信誓旦旦地说,GPU的速度和功能要超越摩尔定律,每6个月就翻一倍。
NV的GPU发展史证明,他确实做到了!GPU的提速幅率远超CPU:
NVIDIA GPU架构历经多次变革,从起初的Tesla发展到最新的Turing架构,发展史可分为以下时间节点:
- 2008 - TeslaTesla最初是给计算处理单元使用的,应用于早期的CUDA系列显卡芯片中,并不是真正意义上的普通图形处理芯片。
- 2010 - FermiFermi是第一个完整的GPU计算架构。首款可支持与共享存储结合纯cache层次的GPU架构,支持ECC的GPU架构。
- 2012 - KeplerKepler相较于Fermi更快,效率更高,性能更好。
- 2014 - Maxwell其全新的立体像素全局光照 (VXGI) 技术首次让游戏 GPU 能够提供实时的动态全局光照效果。基于 Maxwell 架构的 GTX 980 和 970 GPU 采用了包括多帧采样抗锯齿 (MFAA)、动态超级分辨率 (DSR)、VR Direct 以及超节能设计在内的一系列新技术。
- 2016 - PascalPascal 架构将处理器和数据集成在同一个程序包内,以实现更高的计算效率。1080系列、1060系列基于Pascal架构
- 2017 - VoltaVolta 配备640 个Tensor 核心,每秒可提供超过100 兆次浮点运算(TFLOPS) 的深度学习效能,比前一代的Pascal 架构快5 倍以上。
- 2018 - TuringTuring 架构配备了名为 RT Core 的专用光线追踪处理器,能够以高达每秒 10 Giga Rays 的速度对光线和声音在 3D 环境中的传播进行加速计算。Turing 架构将实时光线追踪运算加速至上一代 NVIDIA Pascal™ 架构的 25 倍,并能以高出 CPU 30 多倍的速度进行电影效果的最终帧渲染。2060系列、2080系列显卡也是跳过了Volta直接选择了Turing架构。
下图是部分GPU架构的发展历程:
2.3 GPU的功能
现代GPU除了绘制图形外,还担当了很多额外的功能,综合起来如下几方面:
- 图形绘制。这是GPU最传统的拿手好戏,也是最基础、最核心的功能。为大多数PC桌面、移动设备、图形工作站提供图形处理和绘制功能。
- 物理模拟。GPU硬件集成的物理引擎(PhysX、Havok),为游戏、电影、教育、科学模拟等领域提供了成百上千倍性能的物理模拟,使得以前需要长时间计算的物理模拟得以实时呈现。
- 海量计算。计算着色器及流输出的出现,为各种可以并行计算的海量需求得以实现,CUDA就是最好的例证。
- AI运算。近年来,人工智能的崛起推动了GPU集成了AI Core运算单元,反哺AI运算能力的提升,给各行各业带来了计算能力的提升。
- 其它计算。音视频编解码、加解密、科学计算、离线渲染等等都离不开现代GPU的并行计算能力和海量吞吐能力。
三、GPU物理架构
3.1 GPU宏观物理结构
由于纳米工艺的引入,GPU可以将数以亿记的晶体管和电子器件集成在一个小小的芯片内。从宏观物理结构上看,现代大多数桌面级GPU的大小跟数枚硬币同等大小,部分甚至比一枚硬币还小。当GPU结合散热风扇、PCI插槽、HDMI接口等部件之后,就组成了显卡(下图)。显卡不能独立工作,需要装载在主板上,结合CPU、内存、显存、显示器等硬件设备,组成完整的PC机。搭载了显卡的主板。
3.2 GPU微观物理结构
GPU的微观结构因不同厂商、不同架构都会有所差异,但核心部件、概念、以及运行机制大同小异。下面将展示部分架构的GPU微观物理结构。
3.2.1 NVidia Tesla架构
Tesla微观架构总览图如上。下面将阐述它的特性和概念:
- 拥有7组TPC(Texture/Processor Cluster,纹理处理簇)
- 每个TPC有两组SM(Stream Multiprocessor,流多处理器)
- 每个SM包含:
- 6个SP(Streaming Processor,流处理器)
- 2个SFU(Special Function Unit,特殊函数单元)
- L1缓存、MT Issue(多线程指令获取)、C-Cache(常量缓存)、共享内存
- 除了TPC核心单元,还有与显存、CPU、系统内存交互的各种部件。
3.2.2 NVidia Fermi架构
Fermi架构如上图,它的特性如下:
- 拥有16个SM
- 每个SM:
- 2个Warp(线程束)
- 两组共32个Core
- 16组加载存储单元(LD/ST)
- 4个特殊函数单元(SFU)
- 每个Warp:
- 16个Core
- Warp编排器(Warp Scheduler)
- 分发单元(Dispatch Unit)
- 每个Core:
- 1个FPU(浮点数单元)
- 1个ALU(逻辑运算单元)
3.2.3 NVidia Maxwell架构
采用了Maxwell的GM204,拥有4个GPC,每个GPC有4个SM,对比Tesla架构来说,在处理单元上有了很大的提升。
3.2.4 NVidia Kepler架构
Kepler除了在硬件有了提升,有了更多处理单元之外,还将SM升级到了SMX。SMX是改进的架构,支持动态创建渲染线程(下图),以降低延迟。
3.2.5 NVidia Turing架构
上图是采纳了Turing架构的TU102 GPU,它的特点如下:
- 6 GPC(图形处理簇)
- 36 TPC(纹理处理簇)
- 72 SM(流多处理器)
- 每个GPC有6个TPC,每个TPC有2个SM
- 4,608 CUDA核
- 72 RT核
- 576 Tensor核
- 288 纹理单元
- 12x32位 GDDR6内存控制器 (共384位)
单个SM的结构图如下:
每个SM包含:
- 64 CUDA核
- 8 Tensor核
- 256 KB寄存器文件
TU102 GPU芯片实物图:
3.3 GPU架构的共性
纵观上一节的所有GPU架构,可以发现它们虽然有所差异,但存在着很多相同的概念和部件:
- GPC
- TPC
- Thread
- SM、SMX、SMM
- Warp
- SP
- Core
- ALU
- FPU
- SFU
- ROP
- Load/Store Unit
- L1 Cache
- L2 Cache
- Memory
- Register File
以上各个部件的用途将在下一章详细阐述。GPU为什么会有这么多层级且有这么多雷同的部件?答案是GPU的任务是天然并行的,现代GPU的架构皆是以高度并行能力而设计的。
参考文献
- Real-Time Rendering Resources
- Life of a triangle - NVIDIA\\'s logical pipeline
- NVIDIA Pascal Architecture Whitepaper
- NVIDIA Turing Architecture Whitepaper
- Pomegranate: A Fully Scalable Graphics Architecture
- Performance Optimization Guidelines and the GPU Architecture behind them
- A trip through the Graphics Pipeline 2011
- Graphic Architecture introduction and analysis
- Exploring the GPU Architecture
- Introduction to GPU Architecture
- An Introduction to Modern GPU Architecture
- GPU TECHNOLOGY: PAST, PRESENT, FUTURE
- GPU Computing & Architectures
- NVIDIA VOLTA
- NVIDIA TURING
- Graphics processing unit
- GPU并行架构及渲染优化
- 渲染优化-从GPU的结构谈起
- GPU Architecture and Models
- Introduction to and History of GPU Algorithms
- GPU Architecture Overview
- 计算机那些事(8)——图形图像渲染原理
- GPU Programming Guide GeForce 8 and 9 Series
- GPU的工作原理
- NVIDIA显示核心列表
- DirectX
- 高级着色器语言
- 探究光线追踪技术及UE4的实现
- 移动游戏性能优化通用技法
- NV shader thread group
- 实时渲染深入探究
- NVIDIA GPU 硬件介绍
- Data Transfer Matters for GPU Computing
- Slang – A Shader Compilation System
- Graphics Shaders - Theory and Practice 2nd Edition
苹果的“隐忧”
说起一家公司面临的“挑战”,可能很多人会想到它的强劲对手。比如提起英特尔大家会想到AMD,提起高通则会想到联发科。但说到苹果公司呢?如果以对手的角度来考虑,或许小米、荣耀、OPPO、vivo,甚至三星都显得有些“不够格”,而曾经一度手机市场份额超过苹果、曾经是苹果潜在最大对手的华为,因为受到种种限制,如今手机业务规模已经远不及当年巅峰时期。从全球10月手机销量来看,苹果似乎也的确是一枝独秀,成为唯一一个维持环比正增长的品牌,份额力压三星成为全球第一。去年苹果份额超过三星,是在第四季度。但另一边,从年初市值第一次站上三万亿美元的高点后,苹果的股价就一直波动下行,最低甚至接近两万亿美元,相比高点时减少了近三分之一。
▲苹果近一年来股价变化,来源:谷歌财经
诚然,整个消费电子产业的下行态势、行业景气度的下降是不可忽视的因素,但从苹果自身角度来看,真的已经可以“躺赢”了吗?答案或许并没有表面看上去的那么简单。短短数月间,外媒曝出苹果六七位核心高管离职、灵魂的硬件设计团队几乎要走到“散伙”的边缘,而iPhone年度新品少见的出现了低于预期的市场反馈,iPhone 14标准版首发即“破发”,下个季度营收能否维持增长,也被打上了一个大大的问号。1976年4月1日,21岁的乔布斯与好友一起,给世界带来了苹果公司。46岁时的乔布斯,发布了iPod,用一个“小玩意儿”,颠覆了整个传统音乐产业。而今天,苹果公司也成立46年了,46岁的苹果,并没有在这个节点上像它的创始人一样,带来改变世界的产品,相反,很多人都在说,苹果似乎已经不再能改变世界了。46岁的苹果,或许正面临着一场潜在的“中年危机”。不论是财务业绩、产品技术创新、人员管理、供应链管理还是爆款产品的打造,这些方面的“隐忧”都已找上门来,堵在门口等着苹果来解。对于苹果来说,今年的“冬天”,或许没有那么寒冷,但却同样必须经历。本文福利:苹果公司坚持软硬件一体化,自研芯片和iOS生态构筑核心壁垒,AR/VR、智能汽车等新业务有望成为新的业绩增长点。推荐深度报告《苹果:全球科技巨头》,可在公众号聊天栏回复关键词【智东西333】获取。
01.财务股价之忧:
增长后劲难寻,三万亿渐行渐远
近几个月来,裁员、股价暴跌似乎成为了科技行业的常态,每天占据着各大媒体的头版头条,而苹果似乎成为了一根“独苗”,股价波动并不大,也并未有大范围裁员信息传出。随着苹果最新一个财季的财报发布,其勉强实现同比增长的营收和净利润已经在科技公司中显得较为不易。但实际上,很多明眼人都看得出来,这一季度的数据,苹果“耍了个心眼”,他们把iPhone 14系列的发售日期提前了一周,而新款iPhone首周的销量是极为可观的。虽然没有iPhone 14系列首周的具体销量公布,但从CINNO的国内9月智能手机销量报告中我们能看到,苹果9月的销量达到了460万部,环比增长接近七成,同比增长达到了26.8%,要知道,这个月国内手机厂商销量都在同比大幅下滑。提前一周发售新iPhone,对于苹果三季度财报表现必然是有正向提拉作用的。而这里就产生了一个新问题,四季度苹果要怎么办?要知道,去年iPhone 13系列的“十三香”,可是为苹果带来了“史上季度收入新高”,其季度营收达到了1239亿美元,超过当季微软和特斯拉之和。
▲苹果季度营收情况(单位:十亿美元),来源:Statista
目前看来,到今年年底,苹果并没有计划中的重磅新品公布,去年10月苹果可是甩出了M1 Pro和M1 Max两款重磅“核弹级”笔记本电脑芯片,也大幅带动了高端MacBook Pro产品的销量。今年苹果的M1 Ultra已经提前释放,MR头显似乎仍要等到明年。iPhone产品营收占比仍然超过52%,但iPhone的销售增长也遇到了瓶颈,这在营收占比近两成的中国市场中表现得尤为明显。海外不少分析机构分析师都给出了类似的判断,“未来几个季度,苹果业绩增长将更为艰难”。有分析师指出,目前苹果的市盈率已经达到了历史平均水平的两倍,而华尔街对苹果股票的积极性,在未来几个季度也可能会进一步减弱。苹果可能仍然是最能赚钱的科技公司,但就持续维持高增长这一目标来看,苹果或许已经有些力不从心了。
02.产品创新技术研发之忧:
苹果的创新真的枯竭了吗?
除了扫视摆在明面上的财务指标,我们不妨更加深入苹果,来感受这场“中年危机”。近年来,“苹果还有创新吗”、“苹果创新枯竭了吗”这样的问题一直充斥在各类关于苹果的热议中。苹果已无创新的说法“甚嚣尘上”。智东西曾经深入分析了苹果供应链体系的建立及背后的核心玩法(铁打的苹果流水的供应链:大陆供应商7进8出背后)。可以说,在乔布斯之后的苹果,其创新很大一部分是来源于其独一无二的供应链优势。不论是苹果与台积电深度绑定带来的芯片先进工艺优势,还是与三星各类研发专利交叉授权打造出的顶级手机屏幕,没有强大如斯的供应链,我们很难遇见今天的苹果。从某种程度上来说,苹果通过把控供应链,把控了行业的创新节奏,通过垄断行业创新,保证了自身的技术领先性。这正是苹果创新的源动力之一。当然,在软件操作系统、软硬件底层协同打通、软硬件生态优势等方面,苹果还有着这样那样的创新能力。但时至今日,苹果“颠覆行业”的能力,似乎已经不如从前来的那样明显。比如,在明年即将推出的iPhone 15中,我们能够看到什么“不同”?从目前供应链爆料信息来看,苹果明年的iPhone 15系列采用Type-C接口基本上已经是可以确定的事了,而Pro和Pro Max两款机型的Type-C接口会支持USB 3.2或雷电 3这样的高传输速率规格,进而带动相关传输芯片、接口产业的发展。虽然知名苹果分析师郭明錤对这项改动非常“看好”,认为竞争对手会争相模仿,并带动产业,还列出了多家潜在的获益供应商,但事实是,目前所有的高端主流安卓智能手机,几乎都已经采用了USB 3.0接口。
实际上,苹果的iPhone是为数不多的仍然沿用USB 2.0规格接口的厂商。并且随着无线通信技术的普及发展,今天还在用USB线传输数据的用户,已经不多了。此外,郭明錤还透露,苹果将在iPhone 15系列中采用“无按键设计”,或许会类似iPhone 8上的“实体Home键”,虽然按下仍有“反馈”,但这种反馈是振动马达模拟的,而非真正的实体按键。根据郭明錤的判断,由于这样的改变,iPhone 15系列上的振动马达数量将增加至3个,进而带动立讯精密、瑞声科技这样的供应商相关业务增长。值得一提的是,此前华为、vivo、魅族、HTC等厂商都推出过配备“非实体按键”的智能手机产品。
▲魅族Zero概念机
在这里,我们仅仅简单回顾了一下iPhone 15系列的两个可能的升级点,虽然有些“片面”,但我们也能从中发现一些问题。实际上,不论是接口的改变还是按键设计的变化,这些“创新”给人带来的冲击力的确不强,甚至可以说,近年来一些苹果产品的改进,更多像是在“补课”。比如充电速度的提升、比如屏幕刘海的缩小、比如手机拍照像素的提升、拍照变焦倍数的提升,以及手机续航的增加等。诚然,安卓这边最强手机SoC的CPU性能依然只能跟苹果两代前的A14看齐,但在实际用户体验侧,苹果A系列芯片性能强劲的优势,已经不再像从前来的那么明显。如今各家安卓手机厂商的操作系统纷纷对标“苹果”,流畅度提升比较明显,硬件性能也追赶了上来,SoC的GPU性能甚至已经超过了苹果今年最新A16芯片的GPU。此前,郭明錤爆料称苹果的5G基带研发受阻,团队动荡,下代iPhone 15依然会采用高通的5G基带。消息传出,还曾经一度引发热议。理性地来看,5G基带芯片的研发难度是非常大的,苹果收购英特尔通信基带业务并非没有原因。但即便如此,真正搬出自研的5G基带并用在iPhone中,苹果或许仍然需要一些时间,可以理解。但不得不说,在技术研发层面,苹果并没有普通人想象中的那样“无敌”。强如苹果,在某些自己不擅长的领域,也不得不“低头做事”。苹果造车团队经历的种种波折、几经“解散、重组”,或许也能说明这一问题。当然,苹果在研发硬实力上仍然处于移动芯片行业的领先地位。苹果通过M1系列芯片在能效比方面的颠覆性表现,彻底改变了笔记本电脑芯片市场的格局,苹果的H系列芯片、S系列芯片在耳机、手表中的应用,也成为了这些产品拥有出色表现的关键基础。苹果带给我们的惊喜依然不少,但正如前文所说,如今苹果在技术创新领域面临的挑战同样也不小。回顾苹果近年的研发投入,可以说是只增不减,2021财年苹果研发指出增长了20%,相比上一年17%的增幅再次提升。
▲苹果近年研发投入情况,来源:彭博社
苹果对于技术研发的投入从未停止,且一直在加大,但技术创新的红利,或许真的不像以前那么好吃到了。
03.高管出走人才稀缺之忧:
Jony Ive的“梦之队”几近散场?
虽然前文提到,苹果这艘大船在科技公司裁员潮中,航行的还比较稳,并没有明显的大范围裁员,但事实上,对于苹果来说,其人才团队建设,或许正面临深层次的挑战。从今年8月至今,短短三个多月,苹果至少有六位以上的核心高管离职,其中包括首席信息官(CIO)、首席隐私官(CPO)这样的“CXO”职位任职人员。要知道,苹果虽然有大约100多名副总裁、30多名直接向库克汇报的高管,但在苹果能有“首席官”头衔的高管并不多,大多数都是公司的元老。比如这次离职的苹果前CIO玛丽•邓比(Mary Demby),在苹果已经工作了近30年,当然,据报道,邓比本来也准备退休了,她在有离职意愿后,已经继续在苹果工作了三年,今天终于要正式告别苹果。
▲Mary Demby
邓比所在的部门是苹果的信息系统和技术部门,可能听起来,这个部门有点像“搞后勤”的,但实际上,这个部门被苹果称之为“神经中枢”,负责操作后端基础设施,让员工、客户和供应商能够正常交流沟通,并保持像在线商店这样的服务能够正常运行。该部门直接向苹果的首席财务官卢卡•马埃斯特里(Luca Maestri)汇报,而这位就是每次苹果财报电话会议上和库克一同出来答疑的苹果高管。除了玛丽·邓比,苹果的信息系统和技术部的软件工程副总裁大卫•斯莫利(David Smoley)也即将离开苹果,他给出的名义同样是“退休”。“神经中枢”部门短时间内两位核心高管离开,及时找到接班人是对苹果的一大考验。同样是一员老将的苹果采购副总裁托尼·布莱文斯(Tony Blevins)也于今年9月被免职离开了苹果,原因是公开发表了不当言论。布莱文斯在苹果工作了22年,了解他的员工告诉媒体,在过去20年里,他是“苹果成功不可或缺的一部分”,他帮助苹果提高了利润率、抢在对手之前获得核心技术,鉴于他对苹果供应链的了如指掌及高超谈判技巧,他很难被取代。当然,这只是这位苹果员工的一面之词。此外,还有苹果在线零售副总裁安娜·马蒂亚森(Anna Matthiasson)、苹果公司首席隐私官简·霍瓦特(Jane Horvath)等高管也同在近来苹果的离职潮之列。他们在苹果都有着十年以上的工作经历。值得一提的是,被誉为是苹果传奇设计师乔尼·艾维(Jony Ive)继任者的苹果工业设计副总裁埃文斯·汉基(Evans Hankey)也将于近期离开苹果。乔尼·艾维的大名不必多说,从1992年加入苹果依赖,他一直是苹果的“灵魂设计师”,领导者苹果的设计团队,早期的透明彩色iMac、iPod,以及后期的iPhone、iPad、AirPods、Apple Watch等产品均出自他手。2019年,艾维正式从苹果离职,成立了自己的设计公司LoveFrom,虽然苹果曾与他签订了一份价值超过1亿美元的长期合作合同,但在今年7月合同到期后,双方都没有续签。对于苹果来说,艾维的离开无疑有着重要影响,而更大的考验是,苹果如何找到他的“继任者”?
有苹果员工称,苹果的设计团队正在遭遇“人才流失”的困扰,从Apple Watch发布之后,艾维的小团队已经有至少15名成员离开,很多曾在艾维手下工作的资深设计师都去了他的新公司LoveFrom。这样的人员流动是很少见的,艾维离职前曾说过,在过去的15年里,只有两名设计团队成员离开了苹果,这里面还有一个人是因为健康原因才离职的。艾维的继任者汉基负责监督苹果的工业设计团队,但实际上,她仅仅在这一职位上任职了三年。目前在苹果工业设计团队中,仅存的两位老将,一位是在苹果工作了26年的理查德·豪沃思(Richard Howarth),另一位是在苹果工作了30多年的巴特·安德烈(Bart Andre),但这两位都没有接替汉基的意愿。虽然苹果曾考虑任命软件设计主管戴伊(Dye)负责硬件设计,但老员工们认为,这一举动将“激怒”硬件设计师们。有苹果内部老员工告诉媒体,他们认为从别的公司引进人才是“团队的死亡(death of the team)”,苹果现在需要在内部找人,但苹果又缺乏一个明确的“接班人培养计划”,这是一个很要命的问题。艾维曾经透露,在库克的领导下,苹果关注的重心是运营而不是设计。可以说,苹果的“灵魂”设计部门的元老级人物陆续散场,或许只是一个表象,在业绩增长遇到瓶颈、产品创新乏力之际,苹果源自内部的深层次调整或许已成必然。但无论如何,对于苹果来说,创新离不开人才,而不论是面对MR头显所指向的元宇宙,还是面对电动汽车的新方向,人才难寻的问题将始终是苹果当下面临的突出挑战。
当然,从另一方面来看,46岁,已经超越了绝大部分科技巨头的“年龄”,苹果这些征战了二十年、三十年的员工,最终交棒给“新鲜血液”,或许对于苹果来说也是一次由内而外的革新。或许想成为一家“百年老店”,这是苹果必须要经历的。正如微软、英特尔这样的科技巨头,也在近几年迎来了CEO级别的人事更迭,而如今新的业务在这些公司中都在旺盛生长着,带来了新的变化。“塞翁失马焉知非福”,苹果能否积极面对变化,找到解法,至关重要。
04.供应链结构性调整之忧:
“铁打的果链”神话能否延续?
接下来,我想谈的苹果中年之忧,是一个老生常谈的话题——苹果供应链的结构性调整。在科技行业中,一直有一个说法,就是“流水的厂商,铁打的果链”。诚然,在苹果“日不落”供应链帝国依旧稳固的今天,这句话并没有问题。但在庞大帝国之下,危机与变革也在悄然酝酿着。苹果对于中国大陆供应商的依赖问题,如今正成为外媒讨论热度最高的“苹果话题”之一。虽然近年来,苹果不断把产品的最终组装环节转移至印度、越南、马来西亚等国家,但实际上苹果在制造业方面依然极其依赖中国大陆。苹果iPhone、Mac电脑、AirPods、Apple Watch、iPad等绝大多数产品的“FATP(最终组装,测试和包装)”都要在中国大陆进行,另外郭明錤也提到,苹果的新产品导入(NPI)流程也几乎都是在中国大陆进行的。可以说,虽然富士康是一家中国台湾公司,但它的主要生产工厂都位于中国大陆,比如郑州的富士康工厂。
▲富士康郑州厂区一角
苹果为什么离不开中国大陆?中国大陆制造业员工的平均工资远超印度、东南亚等国家和地区的平均水平,劳动力成本并不是主要优势,那么问题出在哪里?实际上,像富士康这样规模庞大的代工厂,其核心优势在于灵活性。富士康郑州厂区的人数曾一度超过30万人,相当于一座小城市。工人都工作、生活在园区内部,园区里各类设施一应俱全。这样就使得组装生产的队伍可以24小时待命,随时被灵活调拨。比如初代iPhone在上市前几周,乔布斯突然决定将塑料屏幕换成玻璃屏幕,因为他发现塑料屏幕在裤兜里会被钥匙刮花。几周后,8000多名工人在产线上轮班工作,几天之内,让改版后的iPhone出货订单超过了1万部。这样的大规模、集中、灵活的生产能力,目前其他国家还很难具备。站在中国大陆制造业发展的角度,苹果是功不可没的,其带动的就业、其对于生产技术提升的促进效应,都是有目共睹的,立讯精密、歌尔股份、京东方、瑞声科技、舜宇光学等供应链企业,都在加入果链后实现了更快速的成长。而站在苹果的角度,对于中国大陆的过度依赖,在近年来显露出了一些弊端,最明显的莫过于新冠疫情和大国政治博弈带来的生产成本上升。疫情造成的停工、贸易战造成的物流运输成本飙升,都成为苹果必须要面对的问题。
特朗普政府时期,贸易紧张局势导致苹果的产品也被纳入额外征收关税之列;疫情爆发初期,苹果的iPhone SE和iPhone 12都因为工厂停工、产能不足而延迟发布。2021年的缺芯潮虽然没有影响苹果iPhone 13系列的发布,在苹果年末财季的财报电话会上,CFO马埃斯特里称,疫情导致的供应链问题可能会给苹果造成40到80亿美元(约合人民币266到532亿元)的损失。他还特别提到了当时上海疫情给附近工厂带来的影响。近期郑州疫情对于富士康工厂生产的影响,已经波及到1500万到2000万部iPhone 14 Pro的生产,订单削减幅度在20%左右。苹果供应链布局的分散,已经成为必然,并在加速推进中。苹果持续将部分供应链转移出中国大陆,避免“把鸡蛋放在一个篮子里”,甚至连中国台湾地区,苹果都认为“不够放心”。最明显的莫过于台积电的动作,台积电近年来不停地在海外扩张建厂,其中美国亚利桑那州的工厂被议论的程度最高,主要因为它可能会率先投产台积电更先进的芯片工艺制程,比如3nm。苹果也公布了后续将从“美国亚利桑那州一家在建工厂开始为其设备采购芯片”的消息,显然,这说的就是台积电。此外台积电还在美国东岸的维吉尼亚州建立第三座位于美国本土的芯片工厂,在欧洲,台积电正在与德国政府讨论建厂的问题。当然,芯片生产的转移绝非一日之功,一座芯片工厂从规划、建厂、投产,到最终产品通过量产测试、真正大规模生产落地,都是以年为单位计算时间的。这其中的变数也将成为苹果和台积电要共同面临的挑战。建厂的资金问题、美国的补贴政策能否及时落实到位、人才团队的建设培养、供应链链条的打通、外部政策环境的影响,甚至台积电自己能否解决现在工艺研发中遇到的种种技术难题,都会成为挑战。此外,生产制造环节的转移相比高技术壁垒环节,看起来似乎要容易一些,但事实却也是困难重重。比如最明显的一个问题就是,印度、越南这样的国家,在工业基础方面十分薄弱,产业链实则极为“畸形”,在重化工业方面都较为缺乏,而重化工业又是制造业的基石。这就导致一个问题,印度、越南真的是承担了最“纯粹”的组装工作,他们需要从中国进口原材料、零部件、生产设备,自身只承担加工组装任务,产品出口到美国。正如前文所说,苹果核心产品的大规模量产关键环节仍然离不开中国大陆供应链。
放眼全球苹果工厂,根据市场研究机构Technode整理数据,位于中国大陆的工厂数量接近300座,占比达到48%。短期乃至近几年,供应链结构性调整带来的“阵痛”,都会是苹果必须要面对的问题,疫情、国际政治形势等因素的影响,仍然会成为苹果业绩增长的潜在“绊脚石”。
▲苹果供应链工厂数量分布情况,来源:Technode
05.下一个爆款之忧:
当iPhone增长见顶,用什么顶上?
最后,我们来聊点轻松的——苹果的爆款产品打造之忧,产品距离我们普通消费者最近,感知可能也会更强一些。在苹果的产品营收占比方面,iPhone的历年占比基本都在50%以上,诚然,一家公司有一项拳头产品卖爆是很好的一件事,而苹果则是款款产品都是“爆品”,领不少公司羡慕不已。但问题就在于,当拳头产品开始增长乏力时,苹果要怎么延续自己的增长之路?今年9月、10月,iPhone 14系列被砍单的消息可以说传遍了大街小巷。从首发当天开始,iPhone 14系列标准版就已经“破发”,一些三方渠道售价普遍低于官方价格。iPhone 14标准版的市场表现显然不及苹果预期,但Pro版本的强势表现一定程度上拉回了整体销量。不过目前疫情对工厂生产的影响愈发明显,两个Pro版本的缺货情况还在不断加剧,渠道现货也重新回到大幅溢价状态。根据最新消息,由于疫情对生产的冲击,iPhone 14 Pro系列四季度还将减产20%左右。整体来看,美国投行杰富瑞曾发布报告称,iPhone 14系列相较iPhone 13系列,在中国市场首销前三周的销量同比下降了27%左右。当然,iPhone 14系列的销量与销售额与一众友商同期产品相比,依然遥遥领先,这一点不可否认。谈到手机销售,很多人都认为,市场大环境不好,各家厂商的销量都不尽人意,但通过与业内人士的深入交流,更多产业人士认为,智能手机行业的发展可能就是来到了一个“质变”的拐点。智能手机市场“红利多多”的日子可能就此不再有了,疫情只是加速了这一过程,让这一天提前到来而已,“智能手机的此时此刻,恰如PC的彼时彼刻”。因此,苹果iPhone所面临的销售乏力,也许并不能直接“甩锅”给大行情,因为苹果必须要找到新的增长点,才算给出了问题的答案,而不是告诉大家,等手机市场行情恢复,iPhone自然会卖好。2022年三季度全球智能手机出货量约3亿部,同比下降5.3%,继续创造“新低”,一位手机供应链从业者称,明年后年的“回暖”虽是必然,但手机市场要重回三四年前的样子,几乎不太可能了。除了iPhone,苹果的其他业务能否挑大梁呢?目前来看,都还差得远。从财报中可以看到,去年高速增长的Mac电脑,近来的同比增速也开始有所下滑,而在海外市场,苹果推出了很多大力度的企业促销,针对企业用户。比如购买25台以上的MacBook电脑就可以享受10%左右的优惠,这样的促销力度在过去五年中都不曾有过。
▲苹果Mac电脑近期销售情况,来源:彭博社
另外,可穿戴业务一直被誉为是一项高增长“潜力股”,但一方面可穿戴业务的营收占比仅为10%左右,另一方面,即使像TWS耳机、智能手表这类产品,增速也呈现出明显的放缓趋势。根据Canalys最新统计数据,今年三季度,TWS耳机出货量同比增长6%,在可穿戴中占比更小的智能手表销量则同比增长为16%左右。对于本身体量有限的这两块业务来说,很难成为苹果的新增速引擎。服务业务虽然增长迅速,但面临全球反垄断审查的不断加强、政策监管力度的加大,像苹果和谷歌这样的巨头,正在服务业务方面面临更大的挑战。当然,可以预见的是,苹果的MR头显一定会成为新的增长点,但就VR行业目前发展的现状及体量来看,苹果能否探索出更具价值的商业模式、探索出新的用户使用场景、新的杀手级应用,仍然是很大的挑战。传言3000美元左右的定价,也不一定适合所有人。至于造车,先走一步看一步吧。
06.结语:苹果转身,
消费电子行业迎来关键变革期
在苹果万亿美元市值帝国的背后,我们看到即使强如苹果,也仍然面临着诸多挑战。但另一方面,我们也能看到,不论是财务、产品、技术、人才还是供应链方面的挑战,想要解决都绝非易事,但苹果硬是扛着所有难题,依然做出了所在品类最具影响力的爆款新品,并成为全球市值第一的公司。细看年近半百的苹果公司所面临的这些“中年隐忧”,或许正是对消费电子产业发展的一次深度回望,在全球经济环境下行、产品技术创新突破遇到瓶颈的大背景下,科技产业的每一个玩家或许都要思考这些问题。如果是我,我会怎样解决?躺平,还是转型突围?十多年前,那个疯狂到以为可以改变世界的男人,推开了智能手机时代的大门,而十几年后的今天,智能手机的故事,或许该翻开新的一页了。
芯华章发布高性能FPGA双模验证系统
芯华章生态及产品发布会现场
新产品亮相
统一的硬件仿真与原型验证系统
不断发展的SoC和Chiplet芯片创新,使芯片规模不断扩大,系统验证时间不断增加,对高性能硬件验证系统提出了更多的需求,包括虚拟或物理验证、深度调试、提前软件开发等,这些需求往往需要切换多种EDA工具配合完成,不仅存在重复劳动或者耗费人力进行转换的问题,也导致了数据的碎片化,降低了验证重用的可能性,大大降低了验证效率。
桦捷HuaPro P2E
高性能FPGA双模验证系统
作为新一代FPGA双模验证系统,桦捷HuaPro P2E通过统一软硬件平台支持硬件仿真与原型验证双工作模式,帮助开发团队突破了传统软硬件验证工具的割裂限制。这得益于芯华章自主研发的一体化、全自动HPE Compiler,支持大规模设计的自动综合、智能分割、优化实现,并支持深度调试、无限量、任意深度的信号波形采集、动态触发、内存加载和读取等多种调试能力。
HPE Compiler为HuaPro P2E融合多种验证场景打造了坚实的技术基础,在实际测试中,可通过一键式流程缩短30%-50%的验证周期,从而大大降低开发成本,助力大规模系统级芯片设计效率提升。
复杂芯片仿真验证的不同阶段和EDA工具
曦智科技设计验证总监韩福强表示:
芯华章推出的创新双模验证系统HuaPro P2E,专门针对解决大规模的系统级复杂验证需求设计,提供了卓越的软硬协同验证能力,特别是能够满足不断加快的验证周期需求。随着曦智不断加速在光电混合领域的前沿研究,我们愿意和芯华章继续合作部署国产EDA工具,共同提升复杂计算处理能力,提高前沿芯片研发效能。
芯华章研发副总裁陈兰兵表示:
面向自动化和智能化的目标,我们致力于以融合、可拓展的设计流程,减少用户人工投入、缩短芯片验证周期。相比传统的原型验证工具,HuaPro P2E基于统一的硬件、软件工具,高效集成原型验证和硬件仿真双模式,提供兼具灵活与效率的敏捷验证方案,为CPU、GPU、AI、HPC等大规模芯片开发,提供大容量、高性能、调试能力强大的新—代智能硅前验证硬件系统。
打破验证效率藩篱
敏捷验证赋能系统创新
随着芯片的规模和复杂度越来越高,芯片验证的重要性与日俱增,不仅仅局限在满足功能验证需求,也更多参与到设计、架构、软硬协同、功耗等方方面面的优化探索中,在系统级创新及芯片敏捷开发中扮演更重要的角色。
芯华章首席技术官傅勇表示:
面对系统级芯片开发挑战,芯华章以技术为本、以客户为导向,提出敏捷验证的解决方案,其核心是以低成本在各个芯片验证与测试环境中,进行自动化和智能化的快速迭代,并提早实现系统级验证,透过统一的数据库和高效的调试分析,达成验证与测试目标的高效收敛。
秉承敏捷验证理念,芯华章HuaPro P2E打造从软件、硬件到调试的整体解决方案,无缝集成芯华章昭晓Fusion Debug调试器,并借助自研的统一数据库XEDB,让跨模式调试无缝衔接切换,满足从SoC到Chiplet的新一代复杂芯片设计需求,从整体上降低芯片开发的成本、风险和难度。
当今时代,芯片支撑了工业、通信、医疗、交通等几乎所有科技领域与应用场景,是数字经济的发展基石。作为产业最上游的EDA企业,芯华章致力于提供先进的数字前端EDA工具,以完整的数字验证全流程工具,为产业用户打造敏捷验证方案,加速芯片设计中的算法创新和架构创新,赋能系统级应用开发,为数字经济高质量发展强芯固基。
参考文献链接
https://mp.weixin.qq.com/s/V1fSBAseLDbkdWUuvFyrmA
https://www.cnblogs.com/timlly/p/11471507.html
https://mp.weixin.qq.com/s/sPky_-EoW4K-RjGuZ_2t8g
https://mp.weixin.qq.com/s/bOF4lTShkyVCLag1WTufPg