AI芯片结构目标图形处理

AI芯片结构目标图形处理

AI chip architecture targets graph processing

东京——AI处理器设计师Blaize,原名ThinCI(发音为“ThinkEye”),透露其完全可编程图形流处理器(GSP)将于2020年第二季度投入量产。             

Blaize联合创始人兼首席执行官迪纳卡•穆纳加拉(Dinakar Munagala)称,尽管这家成立6年的初创企业对其产品规格(如功率水平和基准测试结果)一无所知,但其测试芯片已于2018年年中在全球范围内进行了16个试点项目,并已在全球范围内开展了16个试点项目。             

Blaize将其GSP描述为能够执行“直接图形处理、片上任务图管理和执行以及任务并行性”。简而言之,Blaize设计的GSP能够满足以前GPU、CPU或DSP无法满足的AI处理需求。             

对于许多研究人工智能处理器的行业分析师来说,这是以前听过的一种说法。             

Tirias Research的首席分析师凯文·克莱威尔(Kevin Krewell)说:“对ThinCI有点了解,但从来没有得到过架构方面的宣传。不过,很高兴改了名字。”             

在幻灯片演示中缺少关于GSP体系结构的技术细节,这在技术分析界引发了挫折和怀疑。然而,穆纳加拉承诺在2020年第一季度发布信息。             

GSP体系结构的高级框图

GSP体系结构由图形流处理器、专用数学处理器、硬件控制和各种类型的数据缓存组成。该公司声称,GSP可以提供:“真正的任务级并行,最小限度地使用片外存储器,深度优先的硬件图形调度,完全可编程的架构。”点击这里获取更大的图像。             

进入合格供应商名单             

Blaize来说,在Munagala看来,一个好消息是一群早期的客户已经在使用普惠制。一年来,Blaize一直在与GSP一起销售台式机。可以简单地插入电源插座并连接到以太网。Munagala说,数据科学家、软件和硬件开发人员已经在评估由GSP实现的系统级功能。             

Blaize拥有8700万美元的融资,得到了早期投资者和合作伙伴的支持,包括Denso、日本的tier one、Daimler和Magna。穆纳加拉说:“从几年前开始,也从汽车领域获得收入。             

手中拿着一块贴好的芯片,许多初创公司都面临着“现在该怎么办?”?“进退两难。Blaize的副总裁兼战略业务发展部(strategic business development)Richard Terrill告诉《经济时报》,“一年前就已经度过了这个阶段。”             

BRAIE把重点放在建设基础设施上,加强了一支工程团队(现在多达325人),延伸到加利福尼亚、印度和英国,正在搬迁到新的设施,并开始在日本和EMEA雇佣现场应用工程师。穆纳加拉说:“正在保持势头。”。

对于Blaize来说,GSP业务不再是在power point演示文稿的规格上与竞争对手竞争。这是为了弄清楚客户将如何为哪些应用程序使用GSP,以及在特定用途中“在系统级别”消耗了多少电能。             

Blaize一直忙于确定其物流,使其产品通过汽车认证,并确保内部流程和文档得到认证。穆纳加拉说:“已经通过了一个审计程序,已经被列入了一份经批准的合格供应商名单”。这是汽车制造商和一线企业迫切需要的一个过程,宁愿避开那些可能持续时间不够长、无法交付产品的初创企业。             

Blaize在英国(Kings Langley和Leeds)雇佣了大约30名工程师,负责汽车产品开发。是一个紧密团结的工程师团队,当想象力剥夺了MIP。Munagala解释说:“是一群高素质的人,在MIPS合作,使基于MIPS的ASICs automotive获得MobileEye的资格。”。

图形计算             

尽管人工智能出现在许多不同类型的神经网络中,“所有的神经网络都是基于图形的,”Munagala解释道。理论上,这允许开发人员利用图形原生结构在单一架构上构建多个神经网络和整个工作流。因此,该公司对其普惠制的新营销宣传是“100%的图形原生”             

然而,blaze并不是图计算领域中的独角兽。Graphcore,Mythic和现在失败的Wave计算都谈到了AI处理中的“数据流图的优化和编译”。             

特瑞尔说:“当然,图形计算已经有60多年的历史了。”            

Munagala说,blaizegsp声称在三个方面与其基于图形的数据流处理器有区别。

首先,“普惠制是完全可编程的”,能够执行“广泛的任务,”说。             

第二,是“动态可重编程的…在一个单一的时钟周期。”             

第三,“提供流媒体的集成”,这使得最小化延迟成为可能。解释说,大规模的效率乘数是通过“数据流机制”来实现的,在这种机制中,非计算性的数据移动被最小化或消除。

GSP体系结构的图形本机特性可以最大限度地减少数据在外部DRAM之间的来回移动。外部只需要第一个输入和最终输出,而中间的所有内容都只是临时的中间数据。这将大大减少内存带宽和功耗。

Blaize系统的既定目标是“尽可能降低延迟,减少芯片、主板和系统级别的内存需求和能量需求。”             

当被问及Blaize的图形计算设计是否具有专利辩护能力时,Mungala说,“对专利组合充满信心。有多个专利,有些已经授予,有些已经申请,但已经做了多年了。”

posted @ 2020-07-10 09:40  吴建明wujianming  阅读(430)  评论(0编辑  收藏  举报