飞腾、鲲鹏、海光、龙芯、兆芯、申威国产CPU处理器
飞腾、鲲鹏、海光、龙芯、兆芯、申威国产CPU处理器
全面分析6大国产CPU处理器,以飞腾、鲲鹏、海光、龙芯、兆芯、申威等为代表的厂商正全力打造“中国芯”
CPU作为计算机设备的运算和控制核心,负责指令读取、译码与执行,因研发门槛高、生态构建难,被认为是集成电路产业中的“珠穆朗玛峰”。纵观全球,Intel、AMD两大巨头领跑通用CPU(桌面与服务器CPU)市场;国内,国产CPU正处于奋力追赶的关键时期,以飞腾、鲲鹏、海光、龙芯、兆芯、申威等为代表的厂商正全力打造“中国芯”。本文将重点围绕国产CPU的发展历程与当前产业链各领军企业的布局情况作详尽解读,具体如下:
1、国产CPU发展历程回溯
2、飞腾:PK生态的主导者
3、鲲鹏:快速崛起的领导者
4、海光:性能领先的实干者
5、龙芯:完全自主的引领者
6、兆芯:合资CPU的探路者
7、申威:为超算而生的强者
一、国产CPU发展历程回溯
回溯中国的国产CPU发展历程,可分为三个阶段:
- 起步:上世纪50-70年代。1956年,半导体科技被列为国家新技术四大紧急措施之一。此后,中科院计算所、109厂、半导体所先后成立,锗晶体管、硅平面晶体管、集成电路等半导体器件相继实现突破,为109乙机、109丙机、156机的诞生分别提供了基础。1975年,伴随大规模集成电路技术的兴起,我国第一台集成电路百万次计算机013机研制成功。这一时期独立自主的产业发展为我国CPU事业打下了坚实基础。
- 转折:上世纪80-90年代。1985年,中科院计算所、半导体所有关研制大规模集成电路的单位和109厂合并,成立中科院微电子中心。但这一时期,由于政策支持力度有所减弱等原因,产业完全市场化但自主性不足。
- 提速:21世纪初至今。从“十五”开始,国产CPU自主性的问题再度提上议程,产业政策不断加码。泰山计划、863计划等催生了一批国产CPU品牌,2002年,我国首款通用CPU——龙芯1号(代号X1A50)流片成功。2006年,“核高基”重大专项推出,“高”即为高端通用CPU。2014年,我国发布《国家集成电路产业发展推动纲要》,国家集成电路产业投资基金(简称国家大基金)第1期成立,主要投资集成电路制造企业。2019年,国家大基金第2期成立,主要投资应用端。
在经历数十年的艰辛探索后,目前,国产CPU产业已初具规模,涌现出一批领军企业。我们根据CPU指令集体系进行分类:
- 1)复杂指令集(CISC)下,以X86架构为主,国内代表厂商包括海光、兆芯;
- 2)精简指令集(RISC)下,涉及ARM架构、MIPS架构、Alpha架构等,国内代表厂商包括鲲鹏(ARM)、飞腾(ARM)、龙芯(MIPS)、申威(Alpha)等。
二、飞腾:PK生态的主导者
飞腾CPU由国防科技大学研究团队创造,起步于1999年。目前是国资比例最高(CEC通过中国长城控股)的国产CPU企业,是聚焦国家战略需求和重大项目的CPU国家队。在以往信创项目中具有较强的实战经验。曾先后尝试X86、Epic、SPARC、ARM四个指令集,并以SPARC开源代码为基础设计了FT-1000、FT-1000A、FT-1500等CPU。之后出于生态考虑,获得了ARM指令集授权,集成全自主处理器内核,形成了覆盖桌面、服务器和嵌入式等领域的完整产品线。
在生态建设上,飞腾作为独立的芯片供应商,只提供芯片,秉承开放策略,与所有整机厂商都是对等的开放合作的关系,且全栈各层次生态伙伴众多,用户有更多选择,供应链安全性有保障。
服务器CPU:FT-2000+/64于2017年发布,集成64个FTC662处理器内核,16nm工艺,主频2.0-2.3GHz,主要应用于高性能服务器领域,性能与Intel Xeon E5-2695V3系列相当。在ARM v8指令集兼容的产品中,FT-2000+/64在单核计算能力、单芯片并行性能、单芯片cache一致性规模等指标上处于先进水平。
2019年5月,基于FT-2000+/64的服务器产品群在福州数字中国峰会上发布。芯片能效(性能功耗比)方面,与其他芯片相比飞腾优势明显;数据库等应用的实测性能对比其他一些国产芯片也相对占优。
桌面CPU:2019年,飞腾发布FT-2000/4,整体性能与Intel Core I5系列相当。FT-2000/4集成4个FTC663处理器核,16nm制程,主频2.6-3.0GHz。
在SPEC 2006测试中,全芯片实测整数计算得分61.1,浮点计算得分62.5,相比上一代的FT-1500A/4提升近1倍,访存带宽提升3倍。目前,FT-2000/4已和国产银河麒麟操作系统完成适配工作,包括联想、长城等整机厂商正在开展终端和板卡研制。
生态健全完善,融合移动生态。飞腾与国内1000余家软硬件厂商构建起了国内最完善最庞大的生态体系,仅2019年就新开案板卡设计430余款,已与千余家软件进行了适配和应用。此外,飞腾兼容安卓生态,在飞腾台式机上可以运行200万级安卓应用,极大拓展了飞腾生态。
具备系统级的安全可信:飞腾是唯一一个完整定义并实现了安全处理器平台架构规范的芯片厂商,考虑了密码加速引擎、密钥管理、可信启动、可信执行环境、安全存储、固件管理、量产注入、生命周期管理、抗物理攻击及硬件漏洞免疫等完整的安全要素,可以有效防止处理器出现安全短板,提升处理器的安全性。
PK体系赋能信息技术应用创新。飞腾CPU积极参与CEC(中国电子集团)主导的PK(即飞腾Phytium CPU和麒麟Kylin操作系统)体系建设,打造安全可靠的中国计算机软硬件基础体系国家队。
三、鲲鹏:快速崛起的领导者
鲲鹏是华为计算产业的主力芯片之一。为满足新算力需求,华为围绕“鲲鹏+昇腾”构筑双算力引擎,打造算、存、传、管、智五个子系统的芯片族,实现了计算芯片的全面自研。鲲鹏系列包括服务器和PC处理器。近年来,华为先后推出Hi1610、Hi1612、Hi1616等服务器CPU产品,不断实现主频与核数的提升,并最终开发出当下的旗舰产品鲲鹏920与鲲鹏920s,分别用于服务器和PC机。
鲲鹏具备“端边云算力同构”的优势。鲲鹏CPU基于ARM V8架构,处理器核、微架构和芯片均由华为自主研发设计。市场上目前存在超过500万基于ARM指令集的安卓应用,与ARM服务器天然兼容,无需移植即可直接运行,且运行过程中无指令翻译环节,性能无损失,相比X86异构最高能够提升3倍性能。
2019年1月,华为宣布推出鲲鹏920,以及基于鲲鹏920的TaiShan服务器和华为云服务。鲲鹏920采用7nm制造工艺。规格方面,支持64内核,主频可达2.6GHz,集成8通道DDR4,支持PCIe4.0及CCIX接口,可提供640Gbps总带宽。鲲鹏920主打低功耗、强性能,在典型主频下,SPECint Benchmark评分超过930,超出业界标杆25%;同时,能效比优于业界标杆30%。
鲲鹏生态蓬勃发展。华为坚持硬件开放、软件开源,使能合作伙伴,推动鲲鹏计算产业发展。目前,已有超过12家整机厂商基于鲲鹏主板推出自有品牌的服务器及PC产品,华为还与产业伙伴联合成立了至少15个鲲鹏生态创新中心。作为鲲鹏计算产业底座的鲲鹏处理器,华为将秉承量产一代、研发一代、规划一代的演进节奏,落实长期投入、全面布局,后向兼容和持续演进的战略,高效满足市场需求。
不过,华为由于是垂直整合型企业,其业务覆盖了从芯片、整机、操作系统、云、软件、集成、销售、服务等各个环节,市场上具有极强的排他性。虽然其在近期国产基础软硬件市场上表达了与其他厂商开放合作的态度,但依然不会单卖芯片,只卖整机和主板,希望其他厂商拿现成的解决方案帮助其开拓市场。这种方式下,下游集成商和整机厂商的利润空间非常狭窄,且发展权受限。
四、海光:性能领先的实干者
海光芯片性能领先,中科曙光为重要股东。海光信息技术有限公司是国内高性能计算机龙头中科曙光的参股子公司。2014年,在天津注册成立;后历经数次股权变更,2018年10月,中科曙光以5.5元/股受让海光信息1.948亿股股权,受让后合计持有海光信息36.44%股权,为海光信息第一大股东。
2016年,海光信息同AMD达成合作,共同合资成立两家子公司,引入X86架构授权。其中,成都海光微电子技术有限公司拥有授权IP所有权,并负责芯片生产,成都海光集成电路设计有限公司负责芯片设计及销售工作。基于AMD提供的Zen1架构,海光开发出8核心桌面版CPU Dhyana、32核心服务器版CPU Dhyana Plus。
海光信息扭亏为盈,协同效应明显。2018年下半年,海光CPU实现量产,并陆续投入商用,主要客户为国内服务器整机厂商。2019年,海光实现营收3.90亿元,净利润为0.60亿元,首次扭亏为盈,体现出与中科曙光等厂商的协同效应明显。一方面,中科曙光拥有优质客户资源、良好销售渠道;另一方面,海光CPU满足国产化需求,将受益于以“中国芯”为底座的IT产业崛起。
近期,中国电信发布服务器(2020年)集中采购项目货物招标集中资格预审公告,公告显示,H系列服务器共集采11185台,CPU类型为鲲鹏 920系列处理器或海光Dhyana系列处理器,标志着国产CPU已在技术复杂度较高的运营商市场实现了规模化的产业落地。
不过,海光的技术来源一致困扰受制于合资的外资公司(AMD 占股51%),往往易受到质疑。而且技术的后续升级也可能存在一定难度(AMD只授权了上一代架构 Zen)。另外,海光不支持移动生态,在移动生态方面劣势较大。
五、龙芯:完全自主的引领者
龙芯是我国最早研制的高性能通用CPU系列。2001年,龙芯起步于中科院计算所,曾得到863、973、核高基等项目的支持,先后成功流片我国首款通用CPU龙芯1号、首款64位通用CPU龙芯2B、首款主频超过1GHz的通用CPU龙芯2E、首款四核CPU龙芯3A等,完成底层核心技术的积累。
2010年,中科院、北京市政府共同牵头出资,龙芯中科技术有限公司正式成立,开始产业化运作。但龙芯基本上是民营企业,其目前的注册资本2.499亿元,有八个股东,其中中科院计算所(国资)25.21%,北京天童芯源科技公司(胡伟武个人投资260万元,占47.54%;其他股份为早期高管所有)25.21%,龙芯员工持股平台8.4%,其他5个股东是民间资本(上海鼎晖华蕴等)41.18%。
龙芯坚持走自主创新与生态建设之路。龙芯走市场带动技术的道路,通过体制内市场引导,带动技术进步,再参与体制外市场竞争。基于MIPS架构,龙芯形成了自主指令集LoongISA,处理器核心的微结构和物理设计全部自主研发,并取得了500多项专利。龙芯学习Intel +Google +Apple的商业和技术模式,打造从端到云开放的全产业链生态体系,实现OS的跨平台兼容。
目前,龙芯共有三个产品系列定位。3号大CPU面向桌面/服务器类应用,定位Intel酷睿/至强系列;2号中CPU面向工控和终端类应用,定位Intel阿童木系列;1号小CPU面向特定应用与需求,曾用于北斗卫星、石油勘探、智能设备(门锁、水表、电表)等方面,实现“上天入地,守卫国门,保护家门”。
龙芯通用CPU在迭代中发展:
- 第一代,基本可用。3A1000、3B1500单核性能较低,SPEC CPU2006测试分值仅2-3分,打开20M文档需要33秒,用户体验一般。
- 第二代,可用。3A/B3000四核处理器采用28nm工艺,主频1.35-1.5GHz,单核性能达到10-11分,超过凌动系列,打开20M文档仅需6秒。具有安全自主程度高、整机厂商品类多、国产化桥片方案等特点。目前,累计出货超过30万颗,是此前信创工程上份额最大的通用CPU。
- 第三代,好用。2019年12月发布的3A/B4000四核处理器实现相同工艺下性能提升一倍,主频1.8-2.0GHz,单核性能达到20-30分,达到AMD 28nm工艺最后产品“挖掘机”的水平,可秒开20M文档。
- 未来,提高主频和核数。3A5000四核桌面CPU将采用12nm工艺,单核性能争取达25-30分,与3A4000兼容,可原位替换,预计2020年二季度流片;3C5000十六核服务器CPU同样采用12nm工艺,支持4-16路服务器,预计2020年三季度流片。
需要关注的是龙芯不支持移动生态,在移动生态方面劣势相对较大。从龙芯国产生态体系分析,支持龙芯的整机相对较少,目前只有5家左右。而由于其芯片虚拟化能力相对不足,导致支持的云平台厂家较少。
六、兆芯:合资CPU的探路者
兆芯系列CPU由上海兆芯集成电路有限公司推出。公司成立于2013年,由上海市国资委下属企业和台湾威盛电子合资成立。公司基于X86架构,成功研发并量产多代通用CPU,形成“开先”、“开胜”两大产品系列,实现了“从双核心到八核心”、“从1.6GHz到3.0GHz”、“从处理器+芯片组方案到SoC单芯片方案”等多方面的发展与创新,具备自主演进发展的能力和条件。
主力产品性能较好。2019年6月,兆芯在上海正式发布新一代16nm X86处理器产品——开先KX-6000和开胜KH-30000。新一代兆芯处理器是首款主频达到3.0GHz的国产通用处理器,支持双通道DDR4-3200内存,采用SoC设计,包含CPU、GPU和芯片组,芯片集成度进一步增强,性能功耗比上一代产品提升3倍。
KX-6000适配win7、win10等主流操作系统,SPEC 2006 INT RATE成绩为170分,单芯片性能已经达到7代i5的同等水平,应用体验大幅提升。
积极开展前瞻研究。兆芯计划于2021年推出开胜KH-40000系列CPU,基于16nm工艺,32核心且支持双路互联,专门面向高性能服务器产品市场。此外,兆芯已着手7nm以下工艺产品的定义和研发工作,作为开先KX-7000系列,延续SoC设计方案,在内存、USB、PCIe等规范方面将瞄准国际同期主流水准。
兆芯生态具有优势。兆芯在实现技术创新与产品进步的同时,始终保持开放合作,最大化兼容X86生态的优势。兆芯CPU广泛应用于电脑整机、笔记本、一体机、服务器和嵌入式计算平台等,能够为党政办公、金融、教育、交通、网络安全、能源等行业提供可靠的解决方案。
兆芯的劣势。兆芯通过合资公司(由上海市国资委下属上海联和投资有限公司和威盛集团所属公司合资成立,中方国资占控股地位)获得 X86 架构授权, 存在着一些“不可控”的因素,因为其技术来源始终是受制于合资的威盛(VIA), 而威盛(VIA)与英特尔 X86 授权协议于 2018 年 4 月到期,威盛已经无法在使用英特尔新的 X86 专利及相关软件,兆芯未来的 X86 产品升级将因此而可能遇阻;此外,兆芯一直在引进的 X86 源代码和微结构基础上改进优化工作,存在因源代码研究不够透彻导致后门无法完全发现的风险。
七、申威:为超算而生的强者
申威CPU由上海高性能集成电路中心研制,基于DEC公司的Alpha架构,并进行了指令集扩展和微结构自主创新,成功应用在国产超级计算机中。
在探索中迭代发展。2006年,申威1单核CPU研制成功,130nm工艺,主频900MHz。2008年,申威2双核CPU推出,同为130nm工艺,主频1.4GHz。2010年,申威1600十六核CPU推出,65nm工艺,运用于神威蓝光超算。2012年,申威1610、410相继推出,均为40nm工艺、1.6GHz主频,分别用于服务器和PC。申威现已形成高性能计算CPU、服务器/桌面CPU、嵌入式CPU三个系列产品线。
申威432、443、3232在研。申威432、443均为4核CPU,分别采用第四代、第五代申威核心,主频将分别达2.2-2.5GHz和2.8-3.0GHz,综合性能将分别达到同期国际主流桌面CPU的60%和80%。申威3232为32核CPU,主要面向云计算、大数据领域,综合性能预计为同期英特尔主流服务器CPU的60%-70%。
申威信息安全产业联盟应运而生。目前已有包括上海高性能集成电路中心、中国仪器进出口(集团)公司、中电科技(北京)有限公司等在内的50多家成员,覆盖芯片设计、基础软件、工业控制、整机及方案、定制服务等多个行业领域。2020年3月,统信UOS也已完成对申威421系列、1621系列机型的适配。
结语:CPU国产化大潮起,群雄正逐鹿中原。CPU作为ICT产业的核心基础元器件,是国家发展的一大“命门”。目前,在国际环境、产业政策、市场需求的联合驱动下,一大批国产CPU厂商奋楫前行,在工艺、性能、生态建设等多个方面不断取得突破,为CPU的自主可控、安全可信做出了贡献,并在“好用”的市场化道路上越走越远。
飞腾系和鲲鹏系:国产Arm架构CPU服务器正在崛起
据公开资料了解:Arm架构和x86是当前最主流的两种CPU架构,相比于x86架构的高度垄断,Arm架构则采用的是开放授权模式,目前国内华为和飞腾已获得永久性Arm V8架构指令层级授权,这是这家厂商高度自主研发服务器芯片的设计根基。基于Arm架构的服务器CPU芯片(鲲鹏CPU、飞腾CPU)在自主创新、安全可控、产业生态、芯片性能等综合实力,目前已成为替代Intel等国外CPU芯片的最佳选择。
国产Arm架构CPU服务器,目前大体分为华为的鲲鹏系和中国电子的飞腾系:鲲鹏系主要是以华为自家TaiShan系列服务器为核心,仅向服务器合作厂商(如神州数码、宝德等)出售鲲鹏主板(非鲲鹏芯片);飞腾系聚焦于国产芯片研发,自身不设计生产服务器,而是直接向服务器合作厂商(如长城、浪潮、联想、宝德、同方、五舟等)出售服务器芯片(如FT1500A/16、FT-2000+/64、腾云S2500)。
鲲鹏920处理器
鲲鹏920处理器。该芯片支持 ARMv8.2 指令集,是行业内首款 7nm数据中心 ARM 处理器,专为大数据处理以及分布式存储等应用而设计。鲲鹏 920 采用多发射、乱序执行、优化分支预测等多种手段提升单核性能。
鲲鹏920 拥有 64 个内核,集成 8 通道 DDR4,可以提供多个接口,主频可达 2.6GHz,总内存带宽最高可达 1.5Tb/s,支持 PCIe 4.0 及 CCIX 接口,总带宽 640Gbps。华为 Cache一致性总线(HCCS)的 480Gbps 片间互联支持最多四颗鲲鹏 920 互联和最高 256 个物理核的
NUMA 架构,保证了鲲鹏 920 超强算力的高效输出。此外,在 Memory 子系统上也进行了大量的优化,采用当前典型的 3 级 Cache 的架构,对 Cache 大小以及延时进行了优化设计。
鲲鹏 920 不同核心下与竞品芯片的对比,其在 48 核的时候,整数打平 intel 至强 8180,功耗低 20%。而 64 核心的鲲鹏 920,则比过 intel至强 8180 33%左右。其中至强 8180 是 intel 用于服务器的旗舰芯片,采用 28 核心,2.5GHz 频率,广泛应用于 X86 服务器中。
飞腾处理器
飞腾对高性能服务器 CPU、高效能桌面 CPU、高端嵌入式 CPU 三条产业线进行了全面的品牌升级。高性能服务器CPU产品线统一以飞腾腾云S系列进行命名,高性能桌面 CPU 产品线以飞腾腾锐 D 系列进行命名,高端嵌入式 CPU 产品线统一以飞腾腾珑 E 系列进行命名,提供定制化、契合各行各业嵌入式应用的解决方案。
PKS 体系最早由飞腾 CPU(Phytium)和麒麟操作系统(Kylin)的“PK 体系”发展而来。依托飞腾全新的硬件级安全机制,以相关可信技术为支撑,PK 体系融合“S-Security”的立体防护安全链,升级为 PKS体系,并全球首创将“可信计算 3.0”技术融入到 CPU、操作系统和存储控制器中,实现底层构架的本质安全,并成为国内首个计算机软硬件基础体系标准。
参考文献链接
https://mp.weixin.qq.com/s/rDVHf8XBznDkWaIXgg9Knw
https://mp.weixin.qq.com/s/ZTwWlVT3txz9mXPadZ5HGw