特斯拉超级计算机Dojo!

特斯拉超级计算机Dojo!

2021年8月15日,特斯拉官方发布海报,预热“特斯拉 AI 日”活动。官方表示,本次活动预计在北京时间8月20日上午9点举行,届时将“邀你见证人工智能的又一次革新”。在这张底色为黑色的海报上,一颗大规模芯片模组的结构图格外吸睛。此前,Dojo公开在推特上为“特斯拉AI日”打call,所以不少人猜测,该结构图展示的可能是特斯拉为超级计算机Dojo设计的专用芯片。早在2019年的Autonomous Day上,马斯克就提到过Dojo,称Dojo是能够利用海量视频数据,做无人监管标注和训练的超级计算机。具备如此优异性能的AI芯片很可能在这几天里揭开神秘的面纱,这让全球从事AI行业的人们一下子就坐不住了。

 

 

 Dojo的发音源自日语,意指柔道中的练功房。Dojo芯片不仅名字带着“武侠气息”,功能也十分强大,这一点从海报上“层层叠起”的芯片模组结构图中或许可以窥得一二。

有业内人士对海报上的这张芯片图进行了解读。该业内人士认为,图中的芯片采用了非常规封装形式,第一层和第五层铜质结构是水冷散热模块;红色圈出的第二层结构由“5*5阵列”共25颗芯片组成;第三层为25个阵列核心的BGA封装基板;第四层和第七层可能是物理承载结构附带一些导热属性;第六层或许是功率模块,上面竖着的黑色长条很可能是穿过散热与芯片进行高速通信的互联模块。

虽然在该芯片正式推出之前一切都是猜测,但特斯拉在AI芯片领域的野心早已路人皆知。早在2019年的Autonomous Day上,马斯克就提到过Dojo,称Dojo是“能够利用海量视频数据,做无人监管标注和训练的超级计算机”。

马斯克的这番话有两个重点。第一个重点是海量数据的收集。自动驾驶需要搜集大量数据,进行神经网络训练,让车辆变得更聪明。现阶段,特斯拉车辆在特定触发条件下会对自动驾驶中的有效数据进行收集,但获取到的数据量非常庞大。在这种情况下,作为特斯拉自身软件优化过的定制超算,Dojo芯片能够大大提升数据运算效率。

马斯克口中的“做无人监管标注和训练”是第二个重点。Alpha Go击败世界围棋大师的案例大家都耳熟能详,无监督训练的范例—Alpha Zero。通过对弈,Alpha Zero仅仅用了三天时间就击败了Alpha Go Lee,用21天打到了“Alpha Master”水平,一时间难觅对手。特斯拉的“无人监管标注和训练”与Alpha Zero的无监督训练一样,指的是系统自身通过海量数据和以前学习的结果进行自动标注和调整,在无需海量研究人员的情况下对神经网络训练进行监督,大幅提升训练效率。

通过高效收集海量数据,对数据进行超高效率计算,能够做无监督训练的Dojo芯片给AI建了一间“练功房”。走出这间“练功房”后,Dojo芯片很可能与Alpha Zero一样,短期内在各自的领域难觅对手。

自动驾驶的必然选择

特斯拉成功自研的FSD芯片是一款高性能、为自动驾驶安全保驾护航的专属芯片,发布时在设计定制上做到了极致,更适应基于神经网络的计算。FSD芯片的高智能化并不足以让马斯克感到满足。通过研发Dojo芯片,马斯克想在自动驾驶领域下更大的一盘棋。

研发Dojo芯片其实是走稳、走好自动驾驶之路。尽管业内风头无两的FSD芯片功能强大,但正如特斯拉在车主手册和网站中警告的那样,特斯拉的自动驾驶和FSD需要人类主动监督。一位忽视这个警告的特斯拉车主很快就为大意付出了代价。这位特斯拉车主曾在社交媒体上发布了使用自动驾驶功能的视频。在视频中,没有把手放在方向盘上。2021年5月份他在南加州的一次车祸中死亡。在各种事故频发的背景下,FSD芯片或许需要更强大的AI芯片来“接棒”。目前来看,Dojo芯片极有可能就是下一位关键的“接棒者”。

马斯克曾在推特上说,只有解决了真实世界的AI问题,才能解决自动驾驶问题。特斯拉在软硬件方面均专注于此。无数的边缘场景只能通过真实世界的视觉AI来解决,因为整个世界的道路就是按照人类的认知来建立的。确实,目前自动驾驶领域最需要解决的难题就是感知。

特斯拉搞超算做什么?

CVPR自动驾驶工作坊的演讲中,特斯拉的AI带头人,高级工程师Karpathy介绍了特斯拉超级计算机的基本情况。

 

 

 这台计算机群采用了5760个算力为321TFLOPS的英伟达A100显卡,组成了720个节点,总算力突破了1.8EFLOPS,10PB的存储空间(读写速度为1.6TBps)。

 

 

 根据计算能力来看,这台超级计算机排名世界第五。

不仅如此,特斯拉表示,不排除给其他公司提供超级计算机集群的可能性。

目前排名第一的超算是日本的「富岳」,在机器学习应用上的算力超频之后是2.15EFLOPS,默频是1.95EFLOPS。

 

 

 与使用显卡的超算不同,「富岳」使用的是基于ARM架构的A64FX处理器。

「肉」脑驾驶员不行,还是得上「硅」脑

Karpathy在演示中强调,特斯拉将坚定不移地将计算机视觉技术作为自动驾驶的核心,并且将自研的超级计算机用于神经网络的研究中去。

 

 

 Karpathy列举了「肉脑」的几大罪证:反应慢(250ms);需要转头和看后视镜来判断环境;不好好开车,喜欢玩儿手机。

紧接着就表示,「硅」脑不仅反应快,而且开车全神贯注,不会时不时地就去刷Ins。

以特斯拉的风格,但凡讲到自动驾驶,就一定要怼一下那个又贵又不好用的Lidar。

 

 

 

 Karpathy 分享了特斯拉超级计算机如何利用计算机视觉来纠正驾驶员不良行为的一些场景,包括紧急制动、交通参与者监测以及红绿灯识别等等。

另外在演示中,Karpathy还展示了被称为踏板误用纠正的功能:当车辆检测到前方有行人或者道路变窄的情况时,当驾驶员把油门当做刹车踩下,车辆则不会加速。

这项功能推出后不知道那些关于特斯拉失控的报道会不会有所减少。

 

 

 经过多年研究,特斯拉团队相信通过监督学习,实现车辆视觉系统对于外界的感知是一个正确的路线。

目前特斯拉已经有超过100万个大约为10秒钟的视频,标注出了视频中60亿个物体的距离、加速度以及速度信息,这些数据量高达1.5PB。

 

 

 要让特斯拉自己的这套自动驾驶AI达到足够的可靠性,还需要更多的时间,这也是为什么特斯拉要制造超级计算机的原因。

这台超级计算机还不是特斯拉的终极目标,根据马斯克的计划,特斯拉未来的Dojo超级计算机算力将要达到每秒钟exaFLOP的级别,也就是百万亿亿次浮点运算。

 

 

 运算速度还要超过「富岳」,成为世界第一。

Dojo:给AI打造的「练功房」

特斯拉在去年的自动驾驶大会上公布了Dojo计划:Dojo将会成为特斯拉用于研发自动驾驶技术的平台。

 

 

 在2020年的自动驾驶技术日上,马斯克不仅向公众展示了由Jim Keller带队研发出来的FSD芯片(目前算力最高的驾驶辅助芯片之一),宣布了特斯拉未来将会成为一家Robotaxti公司的野心。

 

 

 Dojo是特斯拉在自动驾驶之路上一个不可或缺的技术平台。

Dojo发音源自日语,意为在冥想术或者武术中的「练功房」。

未来1.5PB的数据将在这里「刻苦修炼」。

在超高算力的支持下,特斯拉将会在视觉感知的自动驾驶技术路线上一路狂奔。

 

 

 马斯克说过,特斯拉就是一系列初创公司的集合,超级计算机可以看做其中一个初创公司的项目。

英特尔、AMD这些芯片大佬们没想到,居然从汽车圈里突然跑出来一个如此强大的对手。

 

参考链接:

https://www.sohu.com/a/484014485_121134737

https://baijiahao.baidu.com/s?id=1703249429563610941&wfr=spider&for=pc

 

 

 

 

posted @   吴建明wujianming  阅读(1249)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
历史上的今天:
2021-02-10 Megengine量化
2021-02-10 腾讯 angel 3.0:高效处理模型
2021-02-10 深度树匹配模型(TDM)
2021-02-10 X-Deep Learning功能模块
2021-02-10 XLearning - 深度学习调度平台
2021-02-10 Jittor实现Conditional GAN
2021-02-10 计图(Jittor) 1.1版本:新增骨干网络、JIT功能升级、支持多卡训练
点击右上角即可分享
微信分享提示