光电混合计算芯片技术分析

光电混合计算芯片技术分析

给芯片注入一道光会发生什么

人工智能的飞跃式发展使得人类社会对算力的需求呈指数式增长,为计算硬件发展带来了全新的挑战与机遇。光具有高并行度、低延迟、低功耗的优势,意味着其有极大的潜力来帮助加速计算、加速传输,从而提升算力,为人工智能算法带来新的可能性。曦智科技基于大规模光电混合技术的计算新范式,发展出纵向单节点以及横向多节点的算力提升解决方案。在纵向单节点算力提升方面,曦智科技提出了计算新原理——光子矩阵计算(oMAC)。

算力网络新范式

矩阵乘法运算是一种线性计算,被广泛运算于人工智能算法中,在不同算法中占比约60%至90%不等。而光非常适合用于线性计算,它的传播、干涉等行为可被视为线性运算。例如传播过程中对光幅度的连续调节可被视为乘法,双臂干涉[1]可被视为2×2的复数矩阵乘法等。通过堆叠这些基础的运算单元,我们就可实现大尺寸的光子矩阵乘法器。

在光执行计算的过程中,我们可以对光的某些维度的特征进行处理和编码,因此光能够表达个数值。同时,光学器件能够对光的数值进行调节。比如,光在经过不同介质时,通过控制介质的透射率,可以调节光在这个过程中的衰减或增强,如初始输入为1,而经过介质时衰减至0.5。通过不同的干涉和调节,光就能够完成线性计算。

光计算十分高效,计算在光传播的过程中便能完成,整个过程只需要几分之一纳秒,计算延迟极低,且对矩阵规模的增加不敏感,规模越大光的优势就越显著。同时,光执行计算任务的能耗更低。光在执行运算任务时是被动的,这个过程不需要消耗额外的能量,仅仅需要一束光源便可完成整个动作。在运算中,光器件的损耗很低,且不会发热。

此外,光在并行度方面也具有优势。光不会互相干扰,多束光能够在同一条光路里传输和计算,光的波分复用[2]技术允许不同的数在同一时刻被编码在不同的波长上进行矩阵乘运算,因此具有很高的并行度。

曦智科技光子矩阵计算处理器PACE

基于oMAC技术,曦智科技于2021年发布了光子计算处理器PACE (Photonic Arithmetic Computing Engine) ,其核心是64×64的光学矩阵乘法器,由一块集成硅光芯片和一块CMOS微电子芯片以3D封装形式堆叠而成。PACE的单个光子芯片中集成超过10000个光子器件,运行1GHz系统时钟,运行NP完全计算问题的速度与目前高端GPU相比显著提高,成功验证了光子计算的优越性。

注释:

[1]双臂干涉:是一种光学干涉实验装置,光源发出的光线被分成两束,分别经过两条平行的路径(即双臂),然后再次汇聚在一起。当这两束光线重新合并时,它们可能会处于相位差,导致干涉现象的发生。

[2]波分复用:在同一根光纤中同时让两个或两个以上的光波长信号,通过不同光信道各自传输信息的技术,称之为波分复用技术。

曦智科技携全新光电计算产品亮相Hot Chips大会

美国西部时间8月29日,在斯坦福大学举行的全球芯片行业年度盛会Hot Chips大会上,全球光电混合计算领军企业曦智科技进行了全新光电计算产品Hummingbird的首次公开演示。这是继美国西部时间8月8日发布Photowave之后(点击查看更多),曦智科技一个月之内再次推出新产品。至此,曦智科技从光子矩阵计算(oMAC)、片上光网络(oNOC)、片间光网络(oNET)三大核心技术出发,打造的各系列产品均已推出首款硬件,完成了光子计算和光子网络两条产品线的最后一块“拼图”。

Hummingbird是首个用于特定领域人工智能(AI)工作负载的片上光网络(oNOC)处理器,采用先进封装技术,将光芯片和电芯片进行垂直堆叠,集成为一个系统级封装(System in Package,SiP)。

oNOC技术旨在代替电芯片内部或者芯粒之间的电互连网络,把电信号转成光信号,通过光芯片中的光波导网络进行数据通信,提高整体计算效率。通过这种方式可实现算力和内存扩展,提供更低的延时,更大的互连带宽,以及更多的拓扑结构。

曦智科技创始人、首席执行官沈亦晨博士表示:“光子技术是解决计算规模扩展问题的有效方法。随着AI热潮推动了算力需求的指数级增长,传统的解决方案已经很难跟上,业界可以通过将光子技术纳入下一代产品中来解决扩展问题,Hummingbird验证了这一点。”

知名半导体行业评论人、SemiAnalysis首席分析师Dylan Patel则评论说:“曦智科技正在利用其专有的光子技术打破内存壁垒,这有可能改变半导体行业。”

曦智科技光电混合计算新范式

本次发布的Hummingbird,是继2021年年底发布的PACE(Photonic Arithmetic Computing Engine)之后(点击查看更多),曦智科技光子计算产品线的第二款产品,也是该产品线首款应用oNOC技术的硬件。

在Hot Chips大会上,曦智科技工程副总裁Maurice(Mo) Steinman详细介绍了Hummingbird规格参数,以及曦智科技光电混合计算新范式在满足数据中心对更高算力、更低延时、更低功耗的需求上体现出的优势。

Hummingbird通过硅光芯片上的U型光波导传播信号,可实现电芯片上64个核之间的all-to-all全通道广播。这种方式让Hummingbird相比于传统数字互连解决方案显著降低了延迟和功耗,充分体现了光子技术在提升计算表现上的优越性。

Hummingbird计算卡

与片上电网络不同,曦智科技的oNOC技术通过计算节点间全互连拓扑结构,扩展了计算集群规模和配置灵活度。

在oNOC架构下,芯粒间距离几乎不会影响功耗和延迟。因此,该技术非常适合开发新的、更可靠的拓扑结构,并且不再局限于相邻两个芯片之间的传输。Hummingbird使得在单个电芯片或芯粒系统中更高效地利用算力成为可能。借助oNOC,将工作负载映射到不同硬件变得更加容易,为计算系统设计选择合适的拓扑结构也变得更加灵活。

值得一提的是,Hummingbird还内置了曦智科技自主研发的小型化单/多波长激光光源Moonstone,可实现多至8个通道波长的高功率光输出,这是曦智科技在推动光电混合计算产品化和商业化过程中的又一技术突破。

Hummingbird的电芯片和光芯片被共同封装并集成到一个PCIe板卡上,适用于通用的服务器。结合曦智科技的软件开发工具包(SDK),机器学习和人工智能工作负载可以充分利用oNOC的优势实现性能优化。此外,oNOC和Hummingbird IP还可以根据客户应用场景进行定制。

Hummingbird可集成在标准PCIe板卡上,具有良好的通用性

Hummingbird的后续版本将采用光罩拼接技术(reticle-stitching)以支持芯粒架构,从而实现更好的可扩展性,在提高能效比的基础上进一步突破算力瓶颈的制约。

随着Photowave和Hummingbird两款光电混合产品的发布,曦智科技产品市场化进程取得了阶段性进展。曦智科技接下来将持续推动产品迭代进程,拓宽产品应用领域,为客户提供一系列算力跃迁解决方案。

 

参考文献链接

https://mp.weixin.qq.com/s/W7ALYltWHVbB0DPg-vWO5A

https://mp.weixin.qq.com/s/ckJtUrqqp77dhrV9B5iXPQ

posted @ 2023-09-01 05:34  吴建明wujianming  阅读(289)  评论(0编辑  收藏  举报