云计算-存算一体-EDA-技术杂谈
云计算-存算一体-EDA-技术杂谈
参考文献链接
https://mp.weixin.qq.com/s/2-MAT6xI2fcXT4LOO00gSQ
https://mp.weixin.qq.com/s/bryK0IfNciB-UdigtUOfnA
https://mp.weixin.qq.com/s/Snlh8rJByc9vvqEvnIad2g
https://mp.weixin.qq.com/s/CeiWJ_SbzxUIFo4phZ7HGw
云原生背景下的云计算
■ 多维云资源产品化,促动传统应用软件向云原生系统转型
当今,全球头部云计算供应商共同经历了从提供基础设施到提供行业解决方案的历程,单纯的云基础设施服务已不具备前沿竞争力,提供更加贴合下游垂直应用场景的行业级解决方案成为云计算厂商突围竞争的核心策略之一,亦为云计算生态发展的大趋势。相对后起的中小云服务厂商,AWS、谷歌、微软、阿里云具备最优先发机会优势和条件,具体表现为∶
(1)自身拥有复杂的业务生态,或具备多行业云上互联网业务;
(2)先发云平台对接千万级别商家、承载上亿级别用户;
(3)针对双向数据匹配开发程序化计算模式,计算方法沉淀丰富的To B端口服务经验。
■ 随硬件层、软件层云化进程推进,云厂商着手推进云架构下层软硬件结合
应用软件向云原生系统升级的具体形态包括云原生数据库、云原生存储等,然而独立的云原生产品依然存在数据割裂、数据孤岛等问题,为了使分布式系统更加开放、更加产品化,云厂商持续加入多元中间件,如消息中间件、事务处理中间件、数据库中间件等等。2018年起,为便于开发人员基于K8S系统开展云上调研、分析,谷歌领头对大量中间件进行开源化处理,并持续推动中间件的标准化。
纵观云计算形态的发展历程,云厂商已经基本完成了分布式系统向云原生系统的进化,并开启了分布式管控完全标准化和开源化的进程,云上用户可享受愈加开放的集成性云服务平台。
云计算定义及再定义——云原生核心∶虚拟机和容器化
虚拟机向容器的演进 盘活有限的基础资源,在安全、效率、备份、迁移等方面获得原始资源配置
■虚拟机效力升级,追求多核、自研策略成为云厂商发展的大趋势
相对硬件服务器,虚拟机部署成本显著降低,进一步提升虚拟机效力是当前云计算龙头厂商的核心策略之一,其中,效力升级路径包括∶
(1)虚拟化能力向硬件端卸载——头部厂商如AWS、微软等,持续强化自研业务健壮度,开发专用的、负载统一的、可兼容X86等所有应用的CPU;
(2)核数升级——当前云上应用已不局限于单核能力,以ARM架构为例,厂商对多核架构的追求成为大趋势(从60核到98核,到当前120+核)。此外,自研芯片的兴起也成为云本身发展的大趋势。
■虚拟机成搭载多元化订阅服务,助力用户完成云资源的本地化部署
当前,云厂商交付业务主要方式包括一体机交付、certified交付、纯软件交付等。用户可自行购置硬件基础设施并部署业务。多数头部云厂商选择公共云服务本地化部署加虚拟机软件配置的方式,而非出售分布式存储的方式。用户可持续订阅混合云、私有云服务。
云计算定义及再定义——云原生架构核心∶微服务
微服务通过细粒度切分、单独进程、轻量级通信、独立部署四个特征解决了单体应用架构衍生的集中式项目迭代流程。
■微服务架构经历四轮迭代,基本实现模块松耦合
微服务架构(MSA,Microservices Architecture)是一种架构风格和设计模式,提倡将应用分割成一系列细粒度的服务,每个服务专注于单一业务功能,运行于独立部署的进程中,服务之间边界清晰,采用如HTTP/REST等轻量级通信机制。提炼出四点微服务的特征∶1、细粒度切分 2.单独的进程 3.轻量级通信 4.松耦合,可独立部署。
■ 微服务切分方法助力组织实现更细粒度的开发流程切分方法
微服务应用所完成的功能在业务域划分上相互独立,相比单体应用强行绑定语言和技术栈,微服务的好处是不同业务域有着不同的技术选择权,比如推荐系统采用Python要比Java的实现效率要更高。
于组织层面上,微服务对应的团队更小,"一个微服务团队一顿能吃掉两张披萨饼"是业内对正确划分微服务在业务域边界的隐喻,通过最大化"适度职责"实现相对自治,增益开发效率。
于开发效率上,微服务团队虽小却要求着更高的开发迭代速度,业内评价标准是至少两周完成一次迭代,所以也反向对微服务的业务域边界划分提出了要求。
云计算定义及再定义——云原生架构核心∶DevOps
超过50%的受访企业表示对DevOps转型项目存在强诉求,核心关注点在于∶DevOps流程下各业务线需求是否高效到达研发团队,并且是否能够适应敏捷开发流程。
■ DevOps标准化目的在实现于敏捷开发闭环
DevOps标准化流程包括集成环节自动化、部署环节自动化、测试环节自动化以及运维环节的自动化。DevVOps最终循环流以业务敏捷部署为前提,以敏捷型需求为起点,以需求落地为终点,并通过运维、监控、数据追踪分析等后端节点最终实现需求落地目标,构建DevOps闭环。
■标准化理念助力企业DevOps转型
企业选择DevOps转型的目标包括∶缩短前置时间,加快部署频率,提高系统的可用性,减少服务恢复时间,降低变更失败率等。DevOps标准化进程涵盖编码过程、环境配置、代码架构、测试工具、Cl/CD流程、系统环境等方面。
中小企业在DevOps转型过程中,逐步强化自动恢复功能、运维监控数据采集、大数据分析等能力,以协助运维人员在短时间内恢复服务的目标。业务部门及产品研发线DevOps转型项目在落地期间需要着重注意∶①∶DevOps功能质量是否达标;②∶是否充分理解并匹配业务需求。
云计算定义及再定义——云原生全景图简述
■云原生全景4层供应、运行时、编排管理、应用定义及开发)全方位定义基础设施
云原生基础设施包括供应层、运行时层、编排和管理层以及应用定义和开发层。供应层包括自动化和部署工具、容器注册表、安全及合规框架、秘钥管理方案等,供应层工具协助工程师编写基础设施参数以保证一致性、安全性。
运行时层需保障容器化应用程序组件顺利运行并达到通信目标,覆盖云原生存储(虚拟磁盘、持久化存储)、容器运行时(容器隔离、容器资源及安全)、云网络(分布式系统节点、节点连接及通信)。编排和管理层依托云原生天然的可扩展性,顺支持容器化服务形成管理群组。编排和管理层覆盖节点包括编排调度、协调及服务发现、远程进程调度、服务代理、API网关、Service Mesh等。
应用定义及开发层作为云原生全景的最顶层,需要可靠、安全的作业环境。该层涵盖数据库、流和消息传递、应用程序定义和镜像构建、持续集成和交付等环节。业务线或可实现代码在生产环境的自 动部署。
■可观察性及分析工具贯穿云原生全景4层
云原生团队在选择技术栈时,需注重考虑各类工具能力及功能平衡性,以确定最合适的工具组合。与此同时选择适应度最高的数据存储、基础设施管理、消息系统等方案。
■实践过程中,用户及开发者可对应云原生全景路线图选择软件和产品
云原生全景路线图整合用户及平台开发者在实际环境中应用云原生技术所思考和处理的问题,包括容器化、持续集成和持续发布、应用编排、监控和分析、服务代理、服务发现、治理、网络、分布式数据库和存储、流和消息处理、容器镜像库和运行环境、软件发布等。
■云市场需求差异化演进为趋势性事务,云厂商向行业解决方案供应商迈进
基于当前市场背景,头部云厂商进入云钟算重新定义的时期,当下市场的云是否体现出差异化特征仍然基于云厂商对于云计算定义的不同,但可以确定的是,云市场的差异化是趋势性事务。正如AWS、谷歌、微软等全球头部云厂商,从原本单一的基础设施供应商逐渐演化为行业解决方案供应商,云计算服务的集成和整合亦为大势所趋。
一些原本在云上部署自身互联网业务的云厂商,天生具备更优越的机会和条件,例如数据的原生性、庞大的用户访问量、长期实时匹配不同用户端的经验等,种种原生业务助力云厂商在计算方面积累充分的下游应用场景服务经验。
云计算市场差异化特点——单点需求+云原生数据分析
■相对一整套基础设施,云计算市场下游用户更加需要单点问题、单点应用解决方案
在驱动因素方面,观察到,云计算市场下游企业多数是受应用驱动,而非受下层基础设施驱动。例如,政务部门往往并非需要购买一整个云上系统,而是需要解决单点问题。与之相似企业用户也更多需要解决一个或多个应用层面的问题。面对政企用户对单点问题或单点应用层面的需求,当前云厂商能够提供的服务存在距离。
第一代云市场本质上市互联网公司系统,以基础设施为服务核心,但政企用户通常需要的是解决方案。因此,当前云厂商要更加强针对各行各业解决方案的智能化设计,而非简单的流程设置。可以说,传统模式下,供应商将用户系统简单搬运到云上是较为初级、简单、门槛较低的流程,而当下,能否利用更先进技术明显改善用户业务流程是云厂商提高差异化竞争优势的核心战略。
■搭建云原生大数据分析能力成为趋势和潮流
在大数据分析领域,市场的差异化特征亦为优势特征,即构建基于云原生的大数据分析能力。云计算市场发展至今,基础设施已基本满足市场需求,在云原生数据库、云原生存储服务趋于成熟的同时,供应商及下游用户更衍生出对云原生大数据分析服务的需求,基于云原生的数据分析服务将成为市场趋势和潮流。
云计算市场成长空间—Snowflake对市场的启示
Snowflake架构的出现印证了数据仓库理念向微服务模式演进的逻辑,在云服务逐步成熟的时代实现对业务侧需求的精准应对,未来或顺应本地和云端更多的整合、迁移而持续演进。
■ Snowflake时代∶源于云原生且专注于数据仓库闭环服务
区别于多数数据仓库服务供应商,Snowflake构建出诞生于云原生时代的数据服务产品,针对传统数据服务产品受限于自身架构而无法全方位支持云端负载的局限性,为企业面临的多元数据需求和问题提出新型解决方案。
Snowflake强化了数据仓库的价值服务点,核心包括性能、并发性和易用性。在性能层面,启发更多供应商思考针对petabyte级别海量数据的处理方案和降本方案,最大限度发挥云资源效用。
在并发性层面,Snowflake的产品逻辑启发开发者更加重视数据层版本迭代可能对用户业务产生的影响,有效应对self-BI时代数据高并发、安全强需求的挑战。而在易用性层面为了让应用层企业用户更加专注于开发核心业务、创造价值,云原生的数据服务可依托更多的自动化方案承揽底层基础业务,持续提升功能易用度。
■ 底层架构持续演进∶提升存储、计算、管理服务分离度
传统数据仓储服务模式下,用户享用位置相同的资源,在访问量激增的环境下易导致系统崩溃等问题,在高频读写、数据复制、数据迁移等方面也存在显著劣势,延展性、并发性落后于应用层业务需求。而在Snowflake主导的分离式架构下,系统可通过优化规则分配资源,通过节点的独立有效应对延展性和并发性。
打破芯片能效天花板
自文明诞生起,人类一直在寻求能够更加有效存储信息的方式。从远古时代用结绳计数,到在木板、石块、纸本上记录文字,再到数字存储技术诞生,唱片、磁带、光盘、硬盘、闪存等风靡于世,每一轮存储介质的更新换代,都会开启新的市场机遇之门。如今,创新帷幕再度拉开,被寄予打破“内存墙”限制、突破功耗瓶颈的存算一体芯片技术,在后摩尔时代拔地而起。这在杨越眼中,是任何一次底层的技术革新都可能难遇的“人生机会”,可能每隔10年乃至更长时间,才会出现一次。嗅到这一风向,2021年2月,一家领域专家集结的初创公司苹芯科技正式起航。其核心团队技术背景深厚:由新型存储器及人工智能(AI)芯片领域知名学者、杜克大学电子与计算机工程系正教授、IEEE/ACM Fellow陈怡然,以及覆盖软硬件设计的技术专家杨越、章尧君、许振隆组成。陈怡然和杨越是清华大学校友,陈怡然毕业于电子系,杨越毕业于自动化系,章尧君是陈怡然的首位博士毕业生,许振隆曾在台积电任职多年。在创始团队光环加持下,苹芯科技从公开露面至今一直备受业界关注。就在本周,这家创企刚刚完成新一轮千万级美元融资,此前已经完成三款存算一体芯片的流片,其科研成果还入选了今年举办的固态电路顶会ISSCC 2022。苹芯科技联合创始人兼CEO杨越告诉智东西,苹芯除了目前三款IP芯片,今年下半年将有一款面向端侧低功耗应用的完整SoC流片,并以此规划打造完整“智能感知决策系统”,这颗SoC芯片将具备语音处理、人脸检测等多模态功能,用于完成系统商业化落地的目标。
01.清华“90后”师兄弟组队创业要革传统计算体系的命
在清华园求学的那段时光,杨越和陈怡然并无交集,也不会想到多年以后,这位比自己大4届的师兄将在美国斯坦福大学旁的餐馆里,向自己发起组队创业的邀请。1998年,杨越被保送进入清华自动化系,正值陈怡然学完本科课程、开启硕士学业。三年后,陈怡然赴美国普度大学读博士,期间索尼的一篇论文,给了研发非易失性存储器技术的灵感。杨越在清华读完书,又到加拿大多伦多大学计算机工程系攻读博士,开始接触存储相关技术,侧重研究软件方向。另一边,毕业后的陈怡然选择先进入工业界历练一番。曾在新思科技、希捷等芯片和存储名企做研发,早在2009年已经开始探索用非易失性存储器做神经网络加速。后来转向学术界,2010年加入美国匹兹堡大学,后加入美国杜克大学电子与计算机工程系,长期潜心科研。值得一提的是,因对新型存储器、神经拟态计算及深度学习加速等方面的学术贡献,陈怡然教授当选了IEEE和ACM双料Fellow。迄今已发表近500篇论文,获得8次国际会议和研讨会的最佳论文奖、1次最佳海报奖和14次最佳论文提名,在存储及AI计算研究领域声名远扬。杨越则在存储行业持续沉淀,先是博士期间参与创办一家固态硬盘(SSD)公司,并主要负责整个软件的开发测试;后来于2019年初到美国存储芯片巨头美光科技的3D XPoint组做首席系统架构师),其团队研发的前沿存储硬盘3D XPoint X100,性能比传统SSD快了1000倍。
就在专注于各自工作时,信息产业掀起一股新的巨浪——自2016年AI系统AlphaGo首次击败世界围棋冠军起,AI浪潮开始席卷全球,各类AI芯片如雨后春笋般破土而出。彼时,传统的冯·诺依曼计算机体系架构,是大多数AI芯片的根基。但这类架构存在一大局限性:不必要的功耗浪费太多了。对于动辄处理海量数据的AI计算来说,这种局限性日益显得捉襟见肘。该体系下,计算单元与存储单元完全分离,数据在两者之间频繁搬运,造成额外的延时和能耗开销。读写一次内存数据的能耗,甚至会比计算一次数据的能耗多几百倍。当摩尔定律逼近极限,传统架构的芯片性能“天花板”近在咫尺,要做到10倍乃至100倍的性能提升,必须实现架构层面的颠覆式创新。存内计算技术,作为极具潜力的AI芯片未来方向,终于从幕后走到台前。随着新型存储器和AI硬件两大技术潮流交汇,计算与存储之间的界限变得模糊,一个史无前例的时代机遇,摆在了陈怡然、杨越等人的眼前——基于存内计算的底层架构创新,将是一条AI计算的通途。
02.“不想做第1001家AI芯片公司”
在斯坦福大学旁边,陈怡然跟杨越一起吃了顿饭,聊起创办存算一体AI芯片公司的想法。两人一拍即合,杨越觉得,这非常符合对新兴事物的追求,相信存内计算的技术路线能将整个芯片系统的性能提上一个新的台阶。顾名思义,存内计算方法用存储器做计算,从根本上解决时延、功率等方面的损耗,打破了“内存墙”、“功耗墙”的瓶颈,因此能做到数量级程度地提升相关的计算效率、能效比等核心指标。再加上当前AI深度学习算法涉及大量矩阵乘加运算,这些矩阵摆放数据的方式与数据在内存中的存放方式相似,用存储器做AI计算加速的思路日渐成熟,各路资本也纷至沓来,争相下注。此时不创业,更待何时?另外两位技术大牛也决定和陈怡然、杨越组队“干大事”。一位是章尧君,毕业于上海交通大学,后在匹兹堡大学电子工程系读博士,师从陈怡然教授,已在新型存储器领域工作十年,曾设计开发多款MRAM商用芯片。另一位是许振隆,本硕毕业于台湾新竹清华大学,多年任职于台积电,拥有逾20年芯片设计经验,曾带领团队成功交付多款量产芯片。当时参与规划组建这个团队的,还有同为清华校友、现任清华大学电子工程系系主任的汪玉教授。汪玉曾参与创办国内明星AI芯片企业深鉴科技,后来该公司被全球FPGA龙头赛灵思收购,与杨越还是高中同窗。就这样,2021年2月,苹芯科技呱呱坠地。存内计算的英文是“Processing in memory”,缩写为PIM,苹芯科技的英文名「PIMCHIP」便由此而来。“苹芯”的“苹”,即是PIM的谐音。苹芯创始团队兵分两路,陈怡然教授作为董事长总揽全局,CEO杨越和CTO章尧君在北京搭建起苹芯的初始团队,负责整个系统的研发;许振隆则带队负责搭建存内计算的内核。“不想做第1001家AI芯片公司,”聊起创业初心,杨越希望在AI时代背景下,将苹芯科技发展成为非冯·诺依曼架构新计算范式的引领者。用一个新的技术去解决一个旧的问题,这没什么意思,存算一体的使命不只是为了迎合市场需求,而应该去开辟一些新的战场,这才是创新技术的长远价值所在。“更多思考的是,在人工智能时代里面,关注的点到底是什么。你要去做1001家AI芯片公司,还是去为一个之前没有智能化的公司完成智能化转型,哪一个对来说是更有意义的?”
03.创业半年,SRAM存内计算加速器测试成功
什么对苹芯是更有意义的?为了回答这个问题,苹芯团队走访了很多客户,了解对方的痛点、对技术的要求,以及能利用技术实现什么核心价值。“一直对技术抱有敬畏之心,在战略层面沿着先做技术、再做平台、然后做产品的思路,发展过程中几条腿同时走路。”杨越相信比起与巨头狭路相逢,初创公司的机会更多是在细分领域中,能够快速迭代,了解新领域的know-how,快速满足用户的刚需。令杨越很有成就感的是,苹芯的团队氛围非常融洽。“能感觉到大家每天都是非常希望来上班的,工作目标、职业规划都制定得很清晰。”这是一群特别靠谱的工作伙伴。作为一家初创公司,苹芯必须保持很快的流片节奏。第二款芯片流片测试完成后,大家非常淡定,出去吃了顿简单的庆功宴,便马不停蹄地开始推进下一个研发任务。2021年9月7日,苹芯科技宣布其基于SRAM架构的存内计算加速器S200已经测试成功。可以将深度学习算法中占主导的基本运算在存储器内完成,能大幅提升计算效率,并能完成无损精度的运算。苹芯团队称,这款加速器「首次将商用存内计算带入28nm时代」。
▲S200芯片性能参数概览
该成果还发表在有“固态电路领域奥林匹克”之称的芯片顶会ISSCC 2022上。其32Kb无ADC架构SRAM存内计算加速单元基于28nm工艺搭建模块,能效比高达27.38TOPS/W INT8,同时实现1.041Mb/mm2的高面效比。而在同等条件下,世界上多数加速器测试结果,通常介于2-3TOPS/W之间。足足将能效比提升10倍,苹芯是怎么做到的?
04.两大技术优势,三个未来目标
苹芯的存内计算加速器S200有两大技术优势:28nm工艺和全数字化设计。杨越说,选择28nm是综合考虑的决定。先进节点固然能带来更高性能,但也意味着更高的流片和量产成本,这与端侧芯片对成本的苛刻要求相矛盾。28nm则相对成本更低,同时也能展现出SRAM向高级制程节点兼容性好的优势。此外,多家晶圆代工厂具备28nm制造能力,在供给产能方面更加稳定和充裕。S200的另一重优势,是全数字化设计。以前存内计算芯片主要是模拟芯片,优势是能效高,但会牺牲一定精度。而苹芯研发的无ADC架构SRAM存内计算加速单元,不仅能保障精度,能效性也能做到更加领先。除了整型数据的支持外,杨越提到浮点数据也在苹芯的技术支持范围内,处于持续优化验证的过程中。
▲苹芯科技存算一体AI芯片实物照片
软件研发同样是AI芯片公司的战略重心。据杨越观察,端侧客户相对没那么关心芯片底层设计,更在乎端侧芯片的实际表现,包括性能、成本以及好不好用,有三种常见诉求:一是易用性,即上手不费劲;二是可定制性,客户可能有自己的算子,有二次开发需求;三是可扩展性,当硬件计算能力升级,软件不能成为瓶颈。苹芯也非常重视软硬件协同工作,定义有自己的指令集,并围绕上述诉求展开研发,既支持做定制,又顾及升级至数百TOPS板卡时的支持。杨越透露说,苹芯还在做Turnkey方案的准备。为了公司能够坚持自有发展战略规划的实施,苹芯在初期客户与合作伙伴的选择上非常慎重,除了发展理念的契合,还会考虑客户业务需求面临的痛点是否主要由传统冯·诺依曼架构的瓶颈导致。现阶段,希望能通过更多实践,能够充分展现存内计算技术的优势,让这一先进技术能够真正扎根于实际应用,并拓展更宽广的未来。谈及未来三年目标,杨越说,首先是实现落地,二是继续巩固苹芯在SRAM存内计算方向的领先地位,三是在新型存储器研发方面有所突破。“要维护苹芯本身的技术先进性和领先性,因此不管在SRAM还是新型存储器方向,都在持续进行着最前沿的探索。”杨越说。
05.探索打开高能效计算之门的金钥匙
在杨越看来,存算一体AI芯片公司直面的竞争对手不是彼此,而是那些传统的AI芯片公司。“觉得市场并没有进入同质化竞争的阶段。”谈道,“更重要的是大家要拧成一股绳,把存内计算技术的先进性和可落地性展现出来。”相较传统AI芯片,存算一体AI芯片的挑战会更加宽泛。存内计算本身是一门技术壁垒森严的设计方法学,需要多年经验积累、大量资源以及时间投入才能实现。也正因此,过去六年,存算一体AI芯片创业几乎均由技术专家主导。
▲国内在研存算一体AI芯片的企业(智东西制表)
当前存算一体AI芯片创业呈多元化趋势,有模拟芯片与数字芯片之分,有NOR Flash、ReRAM、SRAM、MRAM等不同新型存储器。其目标市场也各不相同,从可穿戴设备、智能家居、视频监控到智能驾驶、云端数据中心应有尽有。这种“各自为政”的特点,使存算一体很难出现一个统一的编程标准,大家都是针对自己的应用场景和性能目标,各建各的软件栈。无论选择小算力还是大算力应用,企业都得摸着石头过河。考虑到现阶段的实际情况与技术发展的现实规律,苹芯团队选择先在小算力上完成全技术通路和商业通路,积累更多能力后,再将算力做大。
▲当前主流AI芯片设计对比(智东西制表)
之所以选择SRAM来完成技术验证与落地,苹芯团队主要出于四点考虑:一是SRAM在存储器历史长河中长期存在,技术相对成熟,稳定性和良率都有保障;二是具备先进节点的兼容性,客户从65nm升级到16nm,能保证继续使用;三是在开发接口方面比非易失性存储器更简单;四是非常短的读写延迟和无限次的in-place擦写次数。尽管SRAM属于易失性存储器,掉电后数据就丢了,但AI实际应用很少出现按分按秒的频繁断电情形,否则这对计算体系结构的其他部分伤害很大,是一个应该主要规避的问题。杨越认为,无论从算力还是落地容易程度来看,SRAM最先可能在端侧取得较大规模的产业化。AI时代的终端及边缘计算需求日益旺盛。如果所有计算都传至云端处理,传输过程会造成时延;此外,很多用户不愿意将自己的隐私数据上传至云端,AI计算本地化的需求正在兴起。这对AI芯片带来新的要求——更高效率、更低功耗,而基于SRAM的存算一体方法恰恰擅长于此。“每一个SRAM的内核能够做到多少绝对算力,非常清楚。”杨越说,芯片的算力、面积、效率等基础指标互相牵制。如果想突出高能效比及成本等优势,那么算力难免要做些平衡。相比其他类型的存储器,SRAM存在单元面积偏大、存在静态功耗高、成本略高等问题,但杨越认为,仅从SRAM本身来考虑,是不全面的。存内计算在系统中扮演协处理器的角色,要比的不止是存储器,而应该从整个系统层面来看性能表现和成本影响。SRAM的这些短板,可以通过系统设计来矫正差距。例如,端侧发生的大多事情都是主控设备不感兴趣的,利用这一特点,苹芯降低功耗的解决方案是在设备待机时将大部分SRAM存算单元关掉,只预留一个睡眠模式,在最小的模块里保持监测状态,当物体检测、语音交互等感兴趣的事件发生时,存内计算模块才会被唤醒。当前存算一体芯片的拳头优势是能效比,其高能效比主要体现在存储单元层,但这个数字还没有跨越到系统级。这是因为内核与系统之间的通信,会受带宽和其他数据处理需求的限制,很多存内计算资源没有被饱和地利用起来,从而没有最大化的发挥存算一体的优势。苹芯正在做面向存算一体的AI算法改良工作,即通过软硬件协同设计,提高计算单元利用率,释放其在兼顾吞吐量和效率方面的优势。考虑到存储密度的限制,目前SRAM更适合做计算密集型应用。但在真实应用场景中,很多网络模型非常复杂,可能存储密集与计算密集兼而有之,因此苹芯还计划研发一个混合设计架构,让ReRAM或MRAM和SRAM搭配协作,不同的存储器各司其职,最终获得更好的整体性能。毕竟,谁能率先设计出兼顾计算密度与存储密度的存内计算硬件架构,谁就拥有了打开高能效计算之门的金钥匙。
06.60个问题与CEO角色适应
现在,杨越的笔记本电脑里,正躺着一个长期思考的问题清单,里面已经列了60个关乎公司发展的重要问题,足足填满了5页slides。杨越说,需要化繁为简,先去解决前三项最重要的问题。最近在看一本书《在硅谷管芯片:芯片产品线经理生存指南》,这是一位硅谷芯片产品线经理写的,总结了芯片设计、生产、销售、管理到市场营销和升级维护的工作全流程。觉得,CEO应扮演好两个角色,一是有销售的属性和精神,是一种不达目的不罢休的精神;二是成为一个好的产品经理,努力提升整个公司的一个形象和品牌,完成技术变现。对于已在海外生活多年的杨越来说,回国创业意味着要融入新环境,但并没有为此感到负担。更看重“能够有机会参与科技的变革和升级的浪潮,并有幸做出贡献。这些人生际遇与经历的价值将远远胜过安稳的生活。”“这个人适应能力和学习能力都非常强。”杨越回忆起创业初期,朋友们给了很多有价值的参考意见。如果非要说有什么需要适应的,那大概是环境的改变:国内外创业氛围大不相同,国内的创业冲劲好过世界上任何一个国家,节奏相对更快、对结果要求更多,而国外很多创业团队以技术为导向,更在乎对技术本身的追求。“本身是有技术洁癖的人,如果看到一些技术上的不求甚解,或者说没有打破砂锅问到底的态度,都会指出并提出严格的要求。” 创业后,杨越的思维发生了一些转变,做公司不止是在技术上展现控制力,而是要在整个行业逐渐树立一个“先行者”的角色。压力当然也是有的。“每天都是在救火状态,”杨越说,每天大大小小的挑战接踵而至,包括公司的战略发展制定、合作伙伴沟通、日常运营,甚至研发中的debug,跟一众芯片公司抢夺人才等等。由于苹芯团队扩张很快,还总是面临办公室空间不够用的问题。还有一些突发事件的应急。比如,今年上半年,连绵不绝的新冠疫情,给苹芯做封装、板级demo等方面带来一些进度延迟。因此,杨越还在持续学习、自提升。工作之余,也会参加一些体育活动,比如喜爱的足球。“在创业之后,踢球的时间越来越少,所以非常珍惜每次踢球的时间。”原来在上大学时,杨越曾是清华自动化系的足球队队长,获得过校联赛冠军;出国后,还在高手云集的多伦多华人联赛中获得过最佳射手。
07.先让第一家客户用起来
现阶段的苹芯,面临“理想与面包”的选择问题。其商务拓展战略团队分布很广,既有跟进消费电子类的,也有智能制造、智慧农业等方向。杨越很清楚,等需求到眼前再行动,会很被动。尤其是创企,必须主动创造需求,将技术带来的直观价值送到客户面前。AI芯片公司得先贴上一个“能落地”的标签,让第一家、第二家客户用起来,第三家到第一百家客户才会接踵而至。“根本逻辑是想去解决一些能够拓展认知边界的问题,这样才叫人工智能。”杨越说,很多人希望AI将人类能完成的事情做到更好,但这不是AI真正的意义所在。“想法是,让AI去完成人完成不了的事情,或者说是很难去完成的事情,换句话说,应该去做雪中送炭的事,而不应该去做锦上添花的事。”据判断,AI的杀手级应用还在探索过程中,市场有巨大的开拓空间,目前AI芯片市场仍然处于爆发前的势态。但相信很快将有一两家AI芯片公司,在非消费电子类行业里打开一个市场。今年上半年,半导体行业普遍面临的资本缩圈问题,但杨越发现,也许是得益于技术先进性,这一趋势对存算一体芯片企业的融资进程和估值并没有造成很大的影响。不过也观察到,技术先进性已经不是资本唯一的考量标准,现在投资正慢慢回归理性,投资机构要看落地方向、财务预期,以及一些芯片创业的经典逻辑。看向未来,存算一体AI芯片要走向大规模商业落地,认为关键在于解决市场需求问题。回顾当年美国半导体的兴起,科学及产业政策的驱动起到很大助力,仅靠补贴、优惠等策略,不足以解决实际需求问题,要带动上游芯片产业的发展,必须鼓励下游的企业使用新的技术产品。在杨越看来,现阶段存算一体AI芯片产业发展面临的主要变量,是政策层面如何帮助芯片公司实现收入的从负转正,即构建正确的商业营收模型,帮助半导体公司生存下来。至于技术难题,那终将会被克服。
08.结语:站着走出去,才是胜利
时间过得很快,苹芯科技转眼已创办18个月了。芯片架构创新的必要性,正随着摩尔定律放缓而愈发凸显。当制程工艺演进逐渐逼近物理极限,后摩尔时代的芯片优化路径,需要借助先进制程、先进封装与架构创新的组合拳。不同时代对计算的要求不同。某种程度上,杨越希望苹芯能够成为“人工智能时代的Arm”。就如当年Arm解决了移动端的芯片需求,现在,苹芯团队也看到了类似Arm当年的机会——当一个硬件设计和创新,能实现更可靠、更稳定的AI计算,能做到多、快、好、省,那么终端智能将变得无处不在。在充满变动的时代背景下,苹芯团队对很多事情也提前做好最坏的打算,为此储备粮草,控制好现金流,专注提升核心竞争力,持续提高自身抵抗风险的能力,以期走得更加长远。进门虽已属不易,能站着走出去,才是胜利。
谷歌开源芯片计划已释放90nm、130nm和180nm工艺设计套件
这是世界首个开源 PDK,目前已经提供 130nm、90nm 以及 180nm 的工艺设计套件,这些数字听起来没有 3nm 那么让人兴奋,但在物联网的众多硬件设计中被广泛应用。
谷歌联手 GlobalFoundries,
释放 180nm 的访问权限
过去一年,谷歌忙于扩展免费开源芯片设计和制造计划,以进一步构建定制芯片的开发人员社区,并围绕开源硬件构建一个蓬勃发展的生态系统。
近日,谷歌宣布与 GlobalFoundries 合作,共同发布基于 Apache 2.0 许可的 GlobalFoundries 180MCU 技术平台的工艺设计套件 ( PDK ),以及用于在 Efabless(一个面向“智能”产品的开放式创新、硬件创建平台)上制造开源设计的免费硅实现程序。
根据 GlobalFoundries 的数据,过去几年大约 73% 的代工收入与移动、物联网和汽车等高增长市场相关。具体来说,使用 180nm 的应用在全球每年的产能为 1600 万余片,到 2026 年将增长到 2200 万片。
180nm 目前应用在电机控制器、RFID、通用 MCU 和 PMIC 以及物联网传感器、双频 RFID 和电机驱动等领域。此 PDK 包括以下标准单元:
- 数字标准单元库(7 轨和 9 轨)
- 低 (3.3V)、中 (5V、6V) 和高 (10V) 电压器件
- SRAM 宏(64x8、128x8、256x8、512x8)
- I/O 和原语(电阻器、电容器、晶体管、eFuse)单元库在此之前,谷歌曾联手 SkyWater Technology ,提供了 130nm 工艺的芯片设计,随后把工艺推进到 90nm 制造。据悉,130nm 工艺在 2001-2002 年期间首次商业化,现在主要用于研究、小型微控制器开发和混合信号嵌入式设计(如物联网设备)领域。
90 nm FDSOI 的工艺则与传统的 CMOS BULK 工艺不同,其在衬底和上层硅之间有一层薄的绝缘体材料。这种薄的氧化物工艺使晶体管比 BULK 工艺中的晶体管要薄得多,并能简化制造工艺。这种额外的绝缘能够在不同的环境条件下提供更好的速度和功率。
过去两年,谷歌在 Apache 2.0 许可下发布这些 PDK,两年内获得了超过 350 个独特的 设计 提交,其中大约 240 个是免费制造的。
开源 PDK 的意义:
降低芯片设计门槛
对于任何人而言,如果想要制造芯片,在已经拥有 RTL(电阻晶体管逻辑电路)的前提下,还需要解决两个问题:一是从芯片代工厂获得 PDK(即 Process Design Kit 工艺设计包),二是有足够的资金支付制造费用。
PDK 是将 RTL 转化为物理芯片的关键步骤。一般来说,可以从代工厂获取的信息包括但不限于:设计规则文档和文件、晶体管 spice 仿真库、各种 EDA 工具所需要的 tech 文件、standard cell 以及 IP 的各类库文件 (verilog, gds, cdl, lef, lib, spice) 等。其中部分可能由第三方 IP 公司提供,但是绝大部分都可以从代工厂获得。当然,代工厂一般不会无偿提供,甚至会收取相当大的一笔费用,即便是很老的工艺也可能需要花费数千美元。
因此,谷歌开源 PDK 的计划对业界来说意义巨大。当然,使用开源 PDK 也需要遵守相关开源协议的规定。
在此前与 SkyWater Technology 的合作中,谷歌曾提到几点要求:申请获得免费 SkyWater PDK 的用户的芯片设计必须开源。其次,芯片的制程限制在 130nm 工艺节点,同时,用户需要向 efabless.com 上传一份开源的 Git URL。最终,Google 会在申请报名的名单中选择 40 个用户团队,为其提供 10 平方毫米的晶片模具,大约 100 个流片。获得申请资格的团队也无需自己找代工厂代工,SkyWater 将为其生产代工。
谷歌的未来计划
源更多 PDK 是谷歌开源芯片生态系统发展的关键一步,谷歌欢迎软件开发人员和硬件工程师、研究人员和本科生、业余爱好者和行业资深人士、新的初创公司和行业参与者,带来新的想法和经过验证的经验来帮助其发展开放的硅生态系统。
GitHub 链接:
https://github.com/google/gf180mcu-pdk(180nm)
https://github.com/google/skywater-pdk(130nm)
谷歌开放硅开发者门户网站:
https://developers.google.com/silicon
三大国产EDA公司,大涨!
A股市场迎来了第三家国产EDA公司——广立微。如图所示,公司股价大涨!
据资料显示,广立微是领先的集成电路 EDA 软件与晶圆级电性测试设备供应商,公司专注于芯片成品率提升和电性测试快速监控技术,是国内外多家大型集成电路制造与设计企业的重要合作伙伴。公司提供 EDA 软件、电路 IP、WAT 测试设备以及与芯片成品率提升技术相结合的全流程解决方案,在集成电路从设计到量产的整个产品周期内实现芯片性能、成品率、稳定性的提升。
公司在集成电路成品率提升领域深耕多年,利用业界领先的高效测试芯片自动设计、高速电性测试和智能数据分析的全流程平台与技术方法,为 Foundry 与 Fabless 厂商提供从 EDA 软件、测试芯片设计服务、晶圆级电性测试设备到数据分析等一系列产品与服务,紧密联系制造端和设计端需求,保证芯片的可制造性,在提高芯片性能、成品率、稳定性的基础上,有效加快产品面市速度。公司先进的解决方案已成功应用于 180nm~4nm 工艺技术节点。
广立微进一步指出,自成立以来,公司始终秉承持续技术创新的发展理念为客户不断创造价值。公司自主研发的 EDA 软件、测试设备硬件以及成品率技术构成的整体解决方案,已得到华虹集团、三星电子、粤芯半导体、合肥晶合、长鑫存储等亚洲主要大型集成电路制造企业的认可。公司的产品和技术实现了高质量的国产化替代,打破了集成电路成品率提升领域长期被国外产品垄断的局面。
具体到产品方面,广立微表示,在设计工具方面,公司开发出了测试芯片版图自动化设计工具 SmtCell 与 TCMagic 等;在数据分析工具方面,公司推出电性数据分析软件 DataExp,其报告生成效率大幅提升;在核心技术方面,公司针对集成电路纳米级先进工艺节点,开发出可寻址测试芯片设计技术,并形成相应软件产品 ATCompiler,能够大幅提高测试芯片面积利用率和测试效率。得益于深厚的技术积累、丰富的实践经验和良好的市场基础,公司持续不断地开发多应用场景、高设计效率的 EDA 产品,大幅提升测试芯片的设计和测试数据分析效率,更好地服务集成电路制造与设计厂商,助力集成电路行业快速发展。
这些领先的产品帮助广立微在过去多年里获不错的营收表现。
谈到本次融资的用途,广立微表示,公司本次拟公开发行不低于 5,000 万股人民币普通股(A 股)股票,募集资金总额95,557.31 万元。本次发行不涉及老股东公开发售其所持有的公司股份,实际募集资金扣除发行费用后,全部用于公司主营业务相关的项目。
在广立微上市暴涨之际,更早之前上市的华大九天和概伦电子业绩也一直走高。其中华大九天在今天涨了20%,概伦电子涨幅超过12%。
首先看华大九天,据介绍,华大九天主要从事EDA工具软件的开发、销售及相关服务。EDA工具是集成电路领域的上游基础工具,应用于集成电路设计、制造、封装、测试等产业链各个环节,是集成电路产业的战略基础支柱之一。公司主要产品包括模拟电路设计全流程EDA工具系统、数字电路设计EDA工具、平板显示电路设计全流程EDA工具系统和晶圆制造EDA工具等EDA工具软件,并围绕相关领域提供技术开发服务。公司相关产品和服务主要应用于集成电路设计及制造领域。
至于概伦电子,资料显示,概伦电子成立于2010年,自成立之初,公司创始团队便认识到全球集成电路先进工艺的演进和集成电路的快速发展,需要集成电路设计方法学和EDA流程创新的支撑,同时明确以“提升集成电路设计和制造竞争力的良率导向设计(DFY)”理念为指导,进行前瞻性的技术研发和产品布局。
近年来,随着先进工艺节点向7nm及以下演进,设计和制造的复杂度及风险程度大幅提升,能否保证芯片具有较高的性能和良率成为集成电路企业关注的焦点,DFY的前瞻性得以充分验证,并经过多年积累进一步演进成为新的“设计-工艺协同优化(DTCO)”方法学。
据招股书介绍,概伦电子围绕DTCO方法学,聚焦于EDA流程创新,择其关键环节进行逐个突破,在器件建模和电路仿真验证两大集成电路制造和设计的关键环节进行重点突破,先后自主研发了具有国际市场竞争力的器件建模及验证EDA工具和电路仿真及验证EDA工具,可有效支撑7nm/5nm/3nm等先进工艺节点下的大规模复杂集成电路的设计和制造,帮助晶圆厂在工艺开发阶段评估优化工艺平台的可靠性和良率等特性,建立精确的器件模型、PDK和标准单元库,并通过快速精准的电路仿真帮助集成电路设计企业有效预测芯片的性能和良率,优化电路设计。
参考文献链接
https://mp.weixin.qq.com/s/2-MAT6xI2fcXT4LOO00gSQ
https://mp.weixin.qq.com/s/bryK0IfNciB-UdigtUOfnA
https://mp.weixin.qq.com/s/Snlh8rJByc9vvqEvnIad2g
https://mp.weixin.qq.com/s/CeiWJ_SbzxUIFo4phZ7HGw