自动驾驶激光雷达与域控制器

自动驾驶激光雷达与域控制器

参考文献链接

https://mp.weixin.qq.com/s/aY4ZPNBMjfQIklq2foWzyw

https://mp.weixin.qq.com/s/DDJdr9JR67HzfOp05USDQA

https://mp.weixin.qq.com/s/3kffmLpuHdMMKOXRYhrgQQ

激光雷达技术及核心元器件

从四个维度深度剖析激光雷达核心技术

激光雷达(LiDAR)的产业化热潮来源于自动驾驶汽车的强烈需求。在美国汽车工程师学会(SAE)定义的L3级及以上的自动驾驶汽车之中,作为3D视觉传感器的激光雷达彰显了其重要地位,为自动驾驶的安全性提供了有力保障。因此,激光雷达成为了产业界和资本界追逐的“宠儿”,投资和并购消息层出不穷。很多老牌整车厂和互联网巨头都展开了车载激光雷达的“军备竞赛”。近期,MEMS激光雷达技术发展最为活跃,并且吸引了大多数投资,同时宝马宣布将于2021年推出集成MEMS激光雷达的自动驾驶汽车。

 

 不同自动驾驶等级对传感器的需求分析

(数据来源:Yole)

伴随着自动驾驶热度上升,激光雷达相关新闻铺天盖地袭来。但是这项在自动驾驶领域尚不成熟的3D视觉技术,不仅公开技术资料稀缺,而且企业和媒体关于各种激光雷达的分类和称谓表达五花八门,例如:机械式、固态、全固态、混合固态;又如:MEMS(微机电系统)、OPA(光学相控阵)、Flash(闪光);亦如:FMCW(调频连续波)、脉冲波;还如:飞行时间法、三角测距法等。这些称谓常常让圈内圈外的人士感到困惑。不用担心,麦姆斯咨询为答疑解惑,本报告从“测距原理、光源、光束操纵、探测器”四个维度对激光雷达核心技术及分类进行了分析,力求让读者对激光雷达错综复杂的技术脉络有清晰的认知。

当在交流“直接/间接飞行时间法、三角测距法”等概念时,这实际上是激光雷达的“测距原理”维度;而谈及“机械式、MEMS、OPA、Flash”等关键词时,这属于激光雷达的“光束操纵”维度;无论是905nm还是1550nm的波长,还是边发射激光器(EEL)或垂直腔面发射激光器(VCESL),这是从激光雷达的“光源”维度交流问题;而涉及PIN、APD(雪崩光电二极管)/SPAD(单光子雪崩二极管)、SiPM(硅光电培增管),或是单点、线阵、面阵,则是从激光雷达的“探测器”维度分析技术。

掌握不同类型激光雷达技术路线及“硬核”

按照光束操纵方式分类,激光雷达主要分为机械式激光雷达、MEMS激光雷达、OPA激光雷达和Flash激光雷达。观察目前产业发展情况,MEMS和Flash技术更受到激光雷达厂商的青睐,有望逐步取代机械式激光雷达。本报告详细分析了上述四种激光雷达的工作原理、优劣势;并对各种激光雷达技术的“硬核”——核心元器件的原理、工艺难度和主要供应商进行了深度剖析,包括MEMS微镜、OPA芯片、ToF(飞行时间)图像传感器、激光器(EEL/VCSEL)、光电探测器(APD/SPAD/SiPM)等;最后还梳理了各种激光雷达的国内外典型厂商。

MEMS微镜作为MEMS激光雷达的核心元器件,毫米级尺寸大大减少了激光雷达的体积,帮助系统摆脱了笨重的马达等机械式装置;同时,MEMS微镜的引入大大减少激光器和探测器数量,极大地降低整体成本;在投影显示领域商用化应用多年的经历及近期在汽车领域的努力,让业界对MEMS微镜的成熟度更为认可。但是,MEMS微镜尺寸的缩小又限制了MEMS激光雷达的光学口径、扫描角度,视场角也会变小;如何通过车规也是MEMS微镜面临的巨大挑战。

OPA激光雷达无需任何机械部件就可以实现对光束的操纵,曾一度被业界看好。但核心元器件——OPA芯片的纳米加工难度非常高。以Quanergy为代表的OPA激光雷达厂商不断修正其产品的量产时间和最远测距范围。那么OPA芯片的实现方式有哪些?面临哪些方面的问题?将在本报告中找到答案。

 Flash激光雷达被视为最终的主流技术路线。Flash激光雷达技术利用激光器同时照亮整个场景,如何提高接收端每个像素可接收的能量,从而实现远距离探测,这对线阵/面阵探测器技术提出了极高要求。本报告对线性雪崩二极管(LMAPD)阵列、盖革模式雪崩二极管(GMAPD)阵列、硅光电倍增管(SiPM)、ToF图像传感器等阵列探测器的工作原理、关键参数进行了详细分析,并梳理了国内外相关厂商信息。

FMCW激光雷达另辟蹊径:测距又测速

调频连续波(FMCW)激光雷达采用基于光源频率调制的间接飞行时间法,通过比较任意时刻反射信号频率与此时刻发射信号频率的之差方法来得到目标的距离信息。该激光雷达类型与上述四种激光雷达(按照光束操纵方式分类)不一样,是从光源波形角度进行分类的。FMCW激光雷达的光源信号调制主要包括三角波调制、锯齿波调制、正弦波调制等方式。由于正弦波调制检测物体时需要调节信号频偏,大多应用于只有一个探测目标的情况,比如高度计。如果希望FMCW激光雷达检测多个目标的距离和速度等信息,通常采用三角波调制。

 

 

 FMCW激光雷达的光源信号采用三角波调制时,通过测量fB1和fB2就可确定与反射目标的距离及其径向速度

FMCW激光雷达采用相干测量技术。相干测量又称光外差探测。激光器发出的光经分束器后分为两束,一束作为本振光,另一束在调制后经光学系统照射到目标物体上,反射回来的光(信号光),与本振光在光电探测器上混频。相干测量具有转换增益高、获得光信号全部信息(振幅、频率、相位)、对背景光滤波性能高、可探测微弱信号等优势。在相干测量中,为了获得最佳的信噪比,需要足够高的本振光功率,这对激光器的要求非常高,平衡光电探测器也不可或缺。平衡光电探测器利用在同一探测系统中放置两组探测器件,分别将本振光和信号光输入到光电二极管中,将光信号转化为电信号,然后经过减法器运算,输出外差信号。通过本报告,会对FMCW激光雷达技术及核心元器件(平衡光电探测器)有更深入的认识。

报告目录:

‐ 缩写列表

‐ 自动驾驶概述

‐ 激光雷达综述

* 定义

* 发展历史

* 产业链

* 四个维度

* 测距原理

* 光束操纵

* 光源

* 探测器

* 主要指标

‐ 机械式激光雷达技术及应用

* 工作原理

* 优劣势分析

* 难点分析

* 主要国际厂商

* 主要国内厂商

‐ MEMS激光雷达技术及应用

* 工作原理

* 优劣势分析

* 实现和构成

* 核心元器件:MEMS微振镜

* 主要国际厂商

* 主要国内厂商

‐ OPA激光雷达技术及应用

* 工作原理

* 优劣势分析

* 核心元器件:OPA芯片

* 主要国际厂商

* 主要国内厂商

‐ Flash激光雷达技术及应用

* 工作原理

* 优劣势分析

* 核心元器件:激光器

* 核心元器件:探测器

* 主要国际厂商

* 主要国内厂商

‐ FMCW激光雷达技术及应用

* 工作原理

* 优劣势分析

* 核心元器件:平衡光电探测器

* 主要国际厂商

* 主要国内厂商

MEMS激光雷达

三菱电机(Mitsubishi Electric)新款MEMS激光雷达(LiDAR)可以准确探测车辆和行人,确保安全可靠的自动驾驶。

据麦姆斯咨询报道,日本三菱电机近日宣布开发出一款紧凑型MEMS激光雷达(LiDAR)解决方案,能够实现超宽的水平扫描视场,准确探测自动驾驶系统前方物体的形状和距离。这款激光雷达解决方案使用双轴(水平和垂直)MEMS微镜向物体发射激光束,并扫描反射光,从而生成车辆和行人的3D图像。三菱电机希望利用这款紧凑型低成本激光雷达解决方案推动更安全的自动驾驶。

 

 

 关键特性


1)大尺寸双轴电磁MEMS扫描微镜,独特的轻巧设计使扫描角度更广

激光雷达在发射激光束之后,需要尽可能多地收集反射光,以便获取最精确的3D图像,尤其是车辆和行人的3D图像。因此,激光雷达系统需要大表面积的反射镜,以最大程度地收集反射光。另外,精确监控车辆周围更广泛的区域,也需要更大的扫描角度。
三菱电机这款新产品在轻巧的设计中集成了业界最大尺寸的电磁式MEMS扫描微镜(尺寸为7mm x 5mm),能够实现水平和垂直双轴扫描。除了尺寸优势,这款MEMS微镜的独特结构有助于其在不牺牲器件刚性的前提下减轻重量。凭借轻巧的设计和高电磁产生的驱动力,可以使扫瞄镜实现水平±15度的大范围运动。当前的垂直扫描范围为±3.4度,三菱电机计划通过改善MEMS悬梁结构将其提高到±6.0度以上。其MEMS微镜可以采用半导体工艺在硅基板上大批量生产。此外,与采用电机进行机械驱动扫描的反射镜相比,MEMS微镜使用的零件更少,有助于提高激光雷达整体解决方案的耐久性。
2)优化的设计缩小了产品尺寸,并能够在更宽广的范围内获取3D图像

 

 

 三菱电机优化了电磁MEMS扫描微镜和光学组件(包括多个激光光源、光电探测器和透镜)的排布,以抑制光学暗角,以及内部组件对激光束的影响。

优化的设计和光学发射/接收机制可实现超宽的水平扫描角度,从而增强了对前方来车、过马路的行人、交通信号灯、交通标志和路边障碍物的扫描能力。随着进一步的改进,三菱电机的目标是使垂直扫描角度超过25度,从而即使在近处也能检测到车辆和行人。
得益于信号处理电路、电源电路和光发送/接收机制的优化布局,这款激光雷达主体的体积仅为900立方厘米。展望未来,三菱电机的目标是开发体积仅为350立方厘米或更小的超微激光雷达设备。

自研域控制器

前段时间九章智驾发布的《“放弃自研域控制器”,缘何成为一些L4级自动驾驶公司的共同选择?》引起了行业的广泛讨论。其中,有一些人并不认同此文的核心观点,认为,是否自研域控制器与公司定位有关,确有许多算法公司不打算做硬件,“但如果定位做行业领导者,为了优化用户体验和更快地商业化落地,当然要做硬件”。

其实,就在前段时间,小马智行发布了其自研的域控制器,并可提供给商用车客户和乘用车客户前装量产使用。

与一些L4自动驾驶公司进军前装乘用车量产时选择聚焦做算法和软件不同,小马是第一家选择从自研域控制器入手的L4公司。

虽然做前装量产的算法和软件也有工程问题要解决,但相较于软件,硬件开发和生产则更依赖过往的量产工程经验,而这也是一些国际Tier 1和一直聚焦做前装量产的域控公司的“主场”优势所在。一家L4自动驾驶公司,公然“挑战”这些公司的“主场优势”,提出要做前装量产域控制器,也让很多行业内人士疑惑和不解。

因为在进入域控制器市场时,将面对的是德赛西威、经纬恒润、福瑞泰克这些量产工程经验丰富的玩家。

在当今大环境下,多数初创公司都“轻装上阵”,为什么小马智行会选择进入域控制器这么“重资产”的行业?面对域控制器市场上的既有玩家,小马智行将如何克服工程能力的短板,又需要具备什么样的优势,才能在激烈竞争中占有一席之地?

带着这些疑惑,九章智驾和小马智行的相关专家进行了深度交流,整理出下文,以飨读者。

一、小马为什么要自研域控制器?
之所以会选择做“自研域控制器”这么“重”的事情,和公司的定位有关:如果公司定位是做自动驾驶算法和软件,自然会本能地回避这些事情;但如果公司定位成为自动驾驶整体解决方案提供商,为了让自动驾驶更快地商业化落地,那么,做一些硬件开发也就顺理成章。

 

 小马智行上海研发中心规划与控制负责人Y介绍说:“虽然小马智行给外界的印象是偏软件和算法的公司,但其实从一开始,小马智行就坚持软硬一体,坚持部分核心硬件自研,无论是做Robotaxi还是做面向规模量产的产品,都是软硬件同步研发。因为始终认为,软件需要硬件的配合才能更好地发挥作用。”

域控制器并不是小马智行唯一自研的硬件。据了解,之前小马智行就自研了红绿灯识别摄像头和定位系统硬件NBOX,也针对性地做了可靠性验证。

“软硬件紧密结合、互相配合,才能达到最理想的状态。”该负责人Y表示。

在算力平台上也是如此。

目前国内公司要想使用Orin X,除了几家自研域控的新势力车企外,其他玩家大多都依赖英伟达在国内的授权合作方。

在和业内专家交流时得知,英伟达的国内授权合作方,在设计域控制器时,一般都会按照英伟达给的参考设计,很少做修改。

究其原因,一方面,要在参考设计的基础上做针对性的优化设计,需要对软件有深刻的理解,而这些授权合作方是缺少这方面know-how的;另一方面,也怕改了之后,万一出问题没有人可以“背锅”。而按照参考设计去做,即使出问题,也可以推脱为是英伟达参考设计的问题。

据小马智行电子电气架构负责人C介绍:“小马智行有超过1400万公里自动驾驶的里程数据,对智能驾驶的理解非常深,经历过几次计算平台的硬件迭代后,归纳总结出域控制器应该怎么设计,也清楚如何优化才能更好地适配智能驾驶软件。所以小马智行自研的域控制器,无论是从性能、安全、成本还是体积上,都更适合智能驾驶应用场景。”

“在小马智行看来,英伟达提供的Orin X的参考设计,其实还是有不少可以优化的地方。小马智行有针对性地做了大量删减,一方面能够减少一些元器件的数量,降低物料成本,另一方面,减少元器件对降低功耗也有好处。”

“除了基于参考设计做删减外,更重要的是,小马智行也发现参考设计并不能完全满足智能驾驶的功能需求,还需要做一些额外软硬件设计来完善其性能。例如,从智能驾驶的需求角度出发,需要对每一路摄像头进行独立控制,包括曝光时间、帧率等。一方面可以避免时间戳插值查找引入的误差,在激光雷达进行采样的时候,触发器同时触发摄像头进行曝光,从硬件上实现时间同步的效果;另一方面独立控制每路相机可以避免不必要的大量数据同时涌入,也可以根据场景调整帧率,最终达到平衡算力需求和降低带宽压力的效果。”

“这只是诸多设计优化的一个例子,更为重要的是,以上所有的这些删减和优化,均得到了英伟达总部工程团队的认可。”

二、相比其他域控厂商,小马自研域控制器的优势
随着L2+/L2++等功能成为近期前装量产功能的攻坚重点和市场热点,尤其是城区NOA等即将推向前装量产,由于城区NOA和Robotaxi的场景相似性,在该场景下有深厚的经验和算法积累的L4公司就展现出了优势。

2016年成立的小马智行,其L4算法已经打磨了五六年,硬件也从最开始的跑Demo时用的工控机,演进到最新发布搭载英伟达Orin X的ADC (Autonomous driving controller)。

为了更好地实现自动驾驶,小马智行不仅自研了自动驾驶算法,也全栈自研了底软、中间件和自动驾驶开发工具链。在数据、算法和算力平台的不断迭代中,对场景、算法、算力的理解也不断演进。

和其他域控厂商相比,这些全栈自研软硬件的积累,让小马智行在设计域控架构时,变得更有底气。

2.1
自研中间件

中间件是应用层算法和硬件底软的“隔离层”,其很大程度上影响了软硬件系统的稳定性和效率。对中间件的深刻理解,有助于更好地优化软硬件设计,对于自研域控制器也有助力。

在中间件领域,与一些L4自动驾驶公司使用ROS或Cyber RT,或者像一些车企一样使用DDS不同,小马智行从一开始就自研中间件,小马智行电子电气架构负责人C说:“因为很了解ROS存在的问题。所以从L4自动驾驶需求出发,像特斯拉一样,基于Linux做了很多裁剪,开发出了自己的中间件,也自研了消息通信系统和机制,从而可实现类似于DDS那样的保证通信实时性等功能,使其可以满足自动驾驶量产的需求。”

“除了能满足通信需求外,在任务调度方面,自研的中间件也可以更加匹配自动驾驶的需求。”

在2022年3月的GTC Digital Spring活动中,小马智行的工程师分享中提到,为了提高传感器数据处理流水线的效率和可靠性,做了很多的软硬件的优化。

其中提到了在数据传输过程中,为了减少CPU和GPU的无效消耗,经过了数次软硬件迭代后,小马智行使用发布-订阅模式,通过模块间的零拷贝消息传递来共享信息。下图为数据量最大的摄像头数据,被下游的许多模块使用进行深度学习推理的链路。

 

 

 小马智行支持 GPU 的零拷贝发布-订阅信息传递,摘自2022 GTC Digital Spring

据C介绍,要提升实时性,仅仅优化中间件是不够的,小马智行和英伟达一起在Linux的内核层(Kernel)做了大量的优化开发,从而可以把实时性做得更好。下图中为2022 GTC Digital Spring中英伟达的工程师和小马智行一起做的实时性优化的成果,其中蓝色方框部分为小马智行的贡献。

 

 

 英伟达和小马智行为提升实时性做的共同开发,摘自2022 GTC Digital Spring

2.2
更深的算法积累

对算法和硬件更好的理解,能够有助于提升对算力的利用率,反过来,对算法有更深的理解和积累,同样也能有助于设计出能更好地匹配算法的域控制器。

虽然城区NOA和Robotaxi的场景很相似,但是技术架构是否相同呢?视觉感知能力的积累是否足够呢?这些问题的回答,直接影响了L4公司对算法的理解和积累,能否复用到面向前装量产的域控制器设计上。

2.2.1
技术架构

技术架构分软件架构和硬件架构。

L4的软件技术架构,可以直接应用在城区NOA这样的高阶智能驾驶上吗?

对于这个问题,小马智行给的答案是——可以。

小马智行上海研发中心规划控制负责人Y介绍说:“Robotaxi和城区NOA的场景很相似,几乎不需要太多的适配,软件技术架构是一样的,甚至很多代码都可以直接复用。”

“从成立开始,小马智行做的研发,积累的知识、数据、代码、算法等,其实很大程度上都可以直接在量产项目上复用。相当于为了准备这个量产项目,小马智行已经有了5年的积累,这也是小马智行的竞争力所在。”

在硬件技术架构上,L4公司的方案和前装量产的方案也逐渐趋同,都用上了大算力SoC,也都装上了半固态激光雷达。

小马智行近期公布了其最新的前装量产传感器方案:只装了一颗前向长距离半固态激光雷达,更多用于提升前向的感知召回率与安全性。在定位和感知模块更多依赖摄像头与毫米波雷达融合,不依赖激光雷达,甚至小马智行也可以提供基于纯视觉的前装量产方案。

 

 

 小马智行量产传感器方案布局

此外,相比于传统的独立的P-box分布式架构,小马智行也可以提供集成GNSS和IMU的域控设计方案,向中央式电子电气架构更进一步,一方面节省了独立的计算单元的成本,另一方面也减少了自动驾驶域控通信接口和线束的复杂度。考虑到适配整车架构的多样性,集成定位传感器的方案可以按需选配。

2.2.2
视觉感知能力的积累

有些人认为,与前装量产以视觉作为主传感器不同,一些L4公司的算法架构还是以激光雷达为主传感器,在视觉感知能力上的积累不如某些前装量产公司,在进入前装量产时可能会不适应。

不过小马智行虽然是L4公司,视觉方面的积累也很深厚。

据小马智行的资深感知工程师Z介绍说:“小马智行一直很重视视觉,在最近特别火的BEV(Bird’s Eye View,鸟瞰图)领域,也有很多的尝试和探索。BEV帮助解决了很多问题,尤其是BEV在跨摄像头融合的优秀表现,能很好地解决近距离cut-in场景,也能大幅提升在高速上被不同的摄像头截断的大车的感知准确率。”

在BEV空间转换时,划分网格需要权衡大小、远近目标。“在BEV网格划分时,小马智行设置了比较近的感知距离,因为认为,更重要的还是近处场景,比如cut-in、拥堵路况、高速上下匝道等。远处的场景,即使稍微有偏差,也不会有很大风险,所以设置了60米的探测距离,在高速上也起到了很好的效果。”

在BEV网络的训练和优化方面,Z介绍道,“由于L4和前装量产的摄像头布局类似,所以很多L4的数据可以直接复用。”

“在训练BEV网络时,与业内一些公司使用云端大模型对视觉数据进行3D重建来生成真值的做法不同,因为有大量带激光雷达点云的真实路测数据,点云感知模型非常成熟,可以直接输出动态目标物的大小、形状、位置、朝向、速度等结果,高精地图里也有车道线、路沿等静态目标物信息,所以直接拿点云感知模型生成的输出结果和高精地图里的静态信息作为真值,来训练BEV模型。由于用于训练的真值的精度高,BEV感知模型的精度自然也就比较高。”

“再通过数据挖掘,对Corner Case持续训练迭代,不断提升BEV模型的泛化能力。”

“当然,训练完之后,BEV模型还要做一些不影响感知精度的量化、剪枝等降低模型复杂度的处理,才能部署到车端。”

 

 

 小马智行感知网络架构

BEV网络可以“脑补”出被遮挡区域的目标,对于这部分“脑补”出的输出结果,不同公司的处理方式也有不同,Z介绍说:“首先,会在感知端将被遮挡区域标示出来,输出给到下游的规控模块,让规控模块判断是否需要针对遮挡区域出现的一些意外情况(如鬼探头等)进行提前应对(如提前减速、绕行等);另一方面,对BEV‘脑补’出的被遮挡区域的动态目标物,会一直保持跟踪(Tracking),并视置信度高低来决定是否将跟踪的结果告知下游的规控模块,从而让规控模块可以提前做准备。”

此外,据Z介绍,小马智行也在尝试“伪激光雷达”,即通过点云数据作为真值,训练神经网络,利用图像生成稠密点云,也被称为“视觉雷达”。伪激光雷达的作用,一方面,能够解决对道路上那些尚未被纳入模型库的异形物体的检测能力,以提升安全性;另一方面,对于没有安装激光雷达的前装量产车辆,伪激光雷达生成的点云数据可以作为真值,来迭代车端的BEV网络。

另外,小马智行已经开始尝试将BEV的应用范围拓展到定位模块,如用BEV输出的车道线和地标箭头等去匹配高精度地图的相应元素,来对车端做一些横纵向的位置纠正。

2.3
更多高质量数据

众所周知,自动驾驶是由数据驱动的。而数据来自于场景,可以这么说,数据直接决定了对自动驾驶场景理解的深刻程度。对场景的深刻理解,也有助于设计更适合自动驾驶场景的域控制器。

至今为止,小马智行已经在北京亦庄、广州南沙、上海等多地开展路测和Robotaxi的运行,累计积累了1400万公里的路测数据,其中有20万公里是无人化测试里程。

真正对自动驾驶有价值的数据,不仅数量要足够多,质量也要足够高。

高质量的数据,一方面指的是高精度的数据,即数据要包括激光雷达点云、图像等数据,尤其是点云数据,可以为摄像头数据提供高精度的训练真值;另一方面指的是场景要多元化,自动驾驶系统能够遇到更多的Corner Case。在这两方面,相比于大多数做前装量产的域控制器厂商,小马智行有明显优势。

在高数据质量方面,小马智行的路测车辆均配置激光雷达,可以提供高精度的点云。

在场景多元化方面,据小马智行上海研发中心规划控制负责人Y介绍:“首先,依赖于Robotaxi和干线卡车这两个产品,小马智行1400万的测试里程中,覆盖了城区和高速公路两大场景。

“其次,小马智行的测试场景既覆盖了北上广深一线城市,也包括了一些二线城市。在不同的城市多地路测,能覆盖因地域和文化不同,引起地不同的Corner Case,来提升自动驾驶系统的泛化能力。小马智行之前曾分析发现,不同城市的司机,驾驶习惯也是有明显差别的,如果没路测过是不了解这个情况的。而其他做前装量产的域控厂商,数据往往局限于高速场景,城区场景的数据相对较少。”

如下为小马智行前段时间公布的一镜到底的路测视频,视频中展现了搭载小马智行最新单Orin X 254 Tops算力的域控制器系统以及搭载量产传感器及软件的车辆,经过高速路和城区道路的表现。

2.4
高效的数据闭环工具链

要想真正实现自动驾驶,不仅需要大量的高质量数据,更重要的是把这些数据利用起来,即需要有高效的数据闭环工具链。

只有足够高效的工具链,才能高效地迭代算法。而只有迭代出最新的算法,才能了解最新的算法对域控制器的需求,才能设计出最适合最新算法的域控制器。

自动驾驶能力 = 自动驾驶数据  x  数据闭环效率

为了更好地进行算法迭代,小马智行也全栈自研了数据闭环工具链。很多L4公司都是全栈自研的,小马智行也不例外,在这方面,比某些量产经验丰富的Tier 1要更有优势。

据介绍,如果客户有需求,小马可以将工具链跟算法模块打包交付。

下面为笔者根据与小马智行数据闭环工具链工程师W的沟通,整理的小马智行数据闭环工具链的特点。

 

 

 小马智行数据闭环工具链特点

2.5
灵活的合作方式

小马智行全栈自研的域控+底软+中间件+算法+工具链,相对于其他域控厂商而言,具有什么优势呢?

小马智行EE架构负责人C说:“如果要兼容其他家的模块,如第三方中间件等,除了相应地适配成本外,还可能因为适配的第三方中间件在某些技术上能力不足,在最终性能表现上会打一些折扣。”

“但是如果客户全部采用自研模块的话,这些模块已经过充分验证,一方面,软硬件适配成本会比较低,另一方面,性能天花板更高,小马智行L4的算法,依托自研的各个模块,经过充分验证展现了出色的性能。”

不过,虽然小马智行软硬件全栈自研,客户全盘采用也有很多优势,但这并不代表小马智行只支持“捆绑式”的合作,事实上,小马智行对合作方式是非常开放,也非常灵活的。

据介绍,小马智行全栈自研的内部模块化程度也是非常高的,可以实现软硬件解耦,包括中间件,甚至算法各模块之间也一定程度是解耦的。在此基础上,小马智行既支持某几部分打包在一起提供,也支持其中某一部分单独对外提供(如中间件或域控+底软)。

小马智行对外合作方式不仅开放,也很灵活。现在有很多车企软硬件分拆定点,单独选定芯片类型、指定某第三方公司作为中间件供应商,甚至还有将算法模块分拆定点等现象,当被问及这种情况下小马智行是否可以支持适配时,小马智行EE架构负责人C表示,对于客户的定制化需求,小马智行也是全力配合的。如果选定芯片不是Orin X,小马智行可以支持对算法迁移;如果已经选定中间件供应商,小马智行也可以支持适配;也可以单独将某个算法模块提供并与上下游适配。如果客户要求中间件要符合AutoSAR,小马智行也可以支持基于AutoSAR 开发中间件。

此外,不同于一些传统Tier 1在底层软件上依赖第三方基础软件供应商而造成灵活度较低,小马方面称,在底软软件上自研且完全掌控,如果客户有一些特殊需求,如在信息安全上有定制化需求,小马智行可以很灵活地进行支持。

“虽然知道软硬件集成一起交付的话,能达到的水平会更高,只交付某一部分并和其他合作伙伴‘拼接’交付,性能上会很不一样。但是理解客户对供应链安全等方面的考虑,会有分拆定点的需求,也愿意积极配合。总之,合作方式非常灵活。”C说道。

三、回应外界的质疑

3.1
如何解决工程问题

就像文章开头提到的,做前装量产的硬件,需要深厚的工程能力的积累,而这也正是以算法能力见长的L4公司的短板。

小马智行将如何应对这个挑战呢?

小马智行EE架构负责人C介绍说:“其实小马智行也积累了不少工程能力,为了能够真正地实现自动驾驶,小马智行从一开始就坚持两个理念:”

“第一,不盲目堆算力。一开始改装Robotaxi的时候,虽然小马智行也用工控机,但是相比于友商工控机的配置,配置要低得多,因为知道,算力即成本,而成本对自动驾驶量产是至关重要的。”

“第二,高集成度。在改装Robotaxi的时候,不同于友商把后备箱全部堆满,把工控机做得足够小,小到可以放在后备箱下面原先放备胎的位置,而可以不占用正常后备箱放行李的空间,这一点也比友商做得要好。”

“为了坚持这两个理念,小马智行花了很多努力,解决如何降低算力、提高集成度这些工程难题,在这个过程也积累了不少工程能力。”

“也正因为不盲目堆算力,再加上积累的工程能力,当小马智行从X86架构的工控机迁移到Orin X嵌入式平台时,上层的一些算法,可以很大程度上复用,甚至许多代码都是不变的。”

在迁移过程中,其实也遇到了很多问题,需要从软硬件各个层面一起解决。

据C介绍:“当初刚进行代码迁移时,一开始运行,结果时延一下提升了五六倍。为了降低时延,只能在应用层算法、中间件和底层软件这几方面分别做优化。”

“既然能从X86架构成功迁移到Orin X上,如果客户有适配其他算力平台的需求,小马智行也可以从容应对。”

进入前装量产阶段,功耗、成本、功能安全和可靠性是域控制器厂商们绕不开的几大问题。对于一个新入局的玩家,要想站得住脚,就更不能在这几个客户最关心的指标上有“短板”。

这里面每一个问题,都像时延问题一样,只有更好地了解自动驾驶使用场景,更深刻地理解自动驾驶软硬件系统,软硬件协同,才能更好地解决。

3.1.1
优化功耗

关于功耗,C介绍说:“功耗是系统性的,既包括芯片的功耗,也包括周边外设和电路的功耗。先说外设电路,根据一直以来积累的对自动驾驶软硬件的深刻理解,基于英伟达的参考设计做了大量的优化,删减了很多不必要的设计——这些器件的减少是能够带来不少功耗降低的,加起来有十几瓦甚至几十瓦了。”

“再说Orin X的功耗,可以分为静态功耗和动态功耗。静态功耗是由芯片本身是参数决定的,改变不了;但动态功耗是可以有很多优化空间的。”

“动态功耗的几个决定因素为电压、频率和负载率,要想降低动态功耗,要么降电压、要么降负载率、要么 降频率。对于车规级产品,电压一般不会降低,小马智行和英伟达一起在降低频率和负载率上面下了很多功夫。”

“在降低负载率方面,比如说实现某个功能的算法,本来要用掉90%的GPU算力,通过一些配置和软硬件共同优化,可以只占用50% GPU就可以了,从而可以降低负载率。”

“在降低频率方面,像Orin X这样的大算力SoC,有12核ARM CPU,当算力需求不大时,可以让这些核的运行频率下降或者直接让其休眠,从而可以大幅降低功耗。在一些极端工况如哨兵模式下,只需要开启相关摄像头,最多把周边环境拍下来传给用户的手机端,不需要让Orin X的性能全部发挥出来,只需要在较低计算资源下,让更其能满足功能需求即可,这就需要小马智行和英伟达一起共同努力,通过优化频率频率,从而降低其动态功耗。”

3.1.3
功能安全

功能安全也是车企们非常重视的,那么在域控上,小马智行能达到什么功能安全等级呢?

C介绍道:“Orin X的功能安全等级一般可以做到ASIL B,也可以做成QM。单纯芯片层级是不能满足自动驾驶的功能安全等级的,所以一般在系统上,会基于ASIL B的Orin X,配置满足ASIL D的MCU,从而可以使整个域控系统最高达到ASIL D的功能安全等级。”

“这个MCU会负责Orin X上系统的监控诊断和报警,并具备功能冗余,即当主系统软硬件故障时,MCU可以进入最小安全风险条件,运行感知、定位、规划控制的算法,实现车道线内无碰撞停车。”

“最终系统功能安全等级,还是取决于客户的实际需求。如果整车电子电气架构中已经有了冗余控制器或其他冗余方案,或者对功能安全等级要求不高而对成本比较敏感,小马智行也可以基于Orin X和ASIL D的MCU,实现ASIL B域控系统级功能安全等级;对于双Orin X版本,小马智行还在参考设计的基础上做了大幅优化,以2 x Orin X+ 1 x MCU 的方案实现ASIL B的系统级功能安全,且该方案也得到了英伟达官方的许可。省掉的MCU既可以降低设计的复杂度,也能够减少系统体积和成本,尤其在当下缺芯的大背景下,一些MCU动辄几十倍的价格涨幅才能拿到现货,省掉一个MCU,对上游的供应链管理无疑是大有好处的。”

据介绍,小马智行已经通过了功能安全的专家评审,过段时间就能拿到ISO26262的功能安全认证,也正在准备ISO 21434道路车辆网络安全管理体系的认证工作。

3.1.4
可靠性

当说到车规级的时候,尤其是电子系统,其实指的是,电子元器件能够满足AEC-Q100系列的认证,而零件总成和系统试验认证,各家车企针对不同位置、不同功能的试验标准和要求也是不一样的。

那么,小马智行的域控制器到底通过了哪些测试验证呢?

C表示,所选的电子器件都要通过AEC-Q100系列的试验,这些非系统级的元器件由芯片厂商提供或由代工厂负责完成,小马智行更多负责一些系统级的试验验证。

以下为小马智行的ADC域控制器通过的试验验证项目和测试规范。

 

 域控制器测试项目及测试规范

不过其中有些测试标准用到了大众汽车和通用汽车的企业标准(如VW80000和GMW3172),而没有采用GB或者ISO的标准,这是为什么呢?

“一方面,GB/ISO和企标在测试项目上是有蛮高的重合度的,另一方面,企标,尤其是像通用汽车和大众汽车这种国际车企巨头,在具体测试标准和要求上面,比GB/ISO的要求更严格,业内的认可度也非常高。”

“按照更严格的企标要求来做测试,这样客户就不担心测试标准问题了。域控的A样和B样已在北上广深多地路测超半年,自动驾驶软硬件均运行正常。”

据介绍,为了更快地进行迭代,小马智行也斥资自建了试验室,如在上海自建了可靠性试验室,在广州深圳自建了高速信号测试试验室,这样可以保证有充分的测试资源,在项目早期就可以及时发现并解决域控制器的关键设计风险。

3.1.2
控制成本

要控制成本,首先是从设计上降低物料成本,其次要控制生产成本,还要降低物料的采购成本。

对此,C介绍说:“在设计上,就像之前提到的,基于这么多年来积累的对自动驾驶软硬件的思考,小马智行基于英伟达参考设计做了大量设计优化,节省了一些器件,从而在设计上能降低一些成本。”

“在生产上,小马智行和一家著名的EMS集成商(代工厂)深度合作,由这家合作伙伴来负责域控制器的生产,在生产成本控制方面非常有经验。”

“在采购物料成本控制上,一方面,在一些关键芯片,比如英伟达的Orin X、英飞凌的MCU等,依靠小马智行和这些芯片厂商长期开发合作中积累的合作关系,小马智行直接和原厂签订合同,拿到相当不错的供货周期和报价,再委托代工厂代为采供;另一方面,一些非关键元器件则由负责生产的代工厂负责采购,因为本身出货量能够保证,元器件采购成本也是蛮低的。”

“结合以上几点原因,目前从客户的反馈来看,小马智行的域控制器成本还是非常有竞争力的。”

3.2
如何解决生产和质量管控问题

上文中也提到,在域控的生产上,小马智行是与代工厂深度合作进行生产的。

据C介绍,从前期的设计阶段,代工厂就开始介入,从生产工艺角度提一些建议,并且双方一起制定DFEMA(设计潜在失效模式及后果分析)和PFEMA(过程潜在失效模式及后果分析)。

在生产阶段,小马智行也是深度参与。在前期产线设计阶段,生产工艺制定和生产控制计划是由双方共同制定,尤其是下线检测的流程和要求、下线后的检测,如抽检还是全检,如何抽检,抽检样品如何做老化试验等,小马智行都会全程深度参与并提出要求,甚至下线检测的检测台架和测试程序,都是小马智行提供给代工厂使用的。量产过程中的防错工艺等,则更多还是依赖经验更为丰富的代工厂。

在生产过程中,从物料的来料到生产下线的全过程,小马智行都是能够实时监控的,确保整个过程中完全可控。

为了更好地进行质量管控,小马智行内部有独立的质量团队,对软硬件的交付质量全程负责,并直接汇报给最高层。

此外,小马智行和代工厂也都通过了ISO9001和ISO/TS16949的体系认证,所有的质量管控措施都落实到APQP(先期产品质量策划与控制计划)里进行实施和跟踪。

3.3
如何解决供应链管理和保供问题

在缺芯的大背景下,供应链管理和保供能力成了车企在选择供应商时不得不考虑的因素。

为了更好地监控生产过程,小马智行和代工厂的MES(制造执行系统)系统打通,小马智行可以实时监控来料、生产和发运状态,第一时间发现问题并预警。

同时,小马智行内部也有独立的供应链团队,来管理战略性的物料,比如英伟达的Orin X芯片或者MCU芯片。

在这方面,因为小马智行和英伟达长期且深度的合作关系,英伟达官方对小马智行提供了非常好的支持。

笔者在和一些使用Orin X的车企专家交流时,听到了很多关于英伟达“官方支持力度不足”的抱怨,导致出了问题只能自己摸索解决,很影响开发效率。

在这方面,因为小马智行和英伟达长期且深度的合作关系,英伟达官方对小马智行提供了非常好的支持。

据小马智行电子电气架构负责人C介绍:“小马智行和英伟达的合作,不仅在域控领域,还包括GPU、数据中心,还有CUDA和Tensor RT等方面。”

“在数据中心方面,小马智行做的一些前沿的预研研究,比如训练、回归测试等方面,英伟达也是给了很大力度的支持。”

“此前小马智行给Tensor RT提交的一些修改,也逐渐在后续的Tensor RT 8等版本上看到了。”

“在域控领域,英伟达美国总部有个10人左右的团队来支持小马智行的工作,每周开两次会,硬件和底层软件各一次。小马智行的问题和想法,不论是小马智行自己的问题,还是客户遇到的问题,都能够得到很快的响应。”

“在关键芯片上,小马智行直接和芯片原厂签订供货合同,可以确保供货周期,非关键零件,则由代工厂进行采购和备货;同时,在设计上也采取了‘Plan B’的设计预留方案,即万一某芯片缺货严重,则可以直接切换到某个‘Plan B’芯片上去,而前期在设计上就做好了切换‘Plan B’的设计预留。小马智行在这方面的工程能力的积累,也能够助力供应链管理,可以保证万一某个芯片缺货时,也不影响域控整体的生产和供货。”

未尽之语
在跟传统的域控制器玩家竞争时,小马智行胜算几何?这也是一开始笔者的疑问,毕竟传统玩家的经验优势更为明显。

但在写完这篇文章后,笔者想明白了一个道理:是鞋决定脚,还是脚决定鞋?

当鞋子刚出现时,肯定是卖方市场,因为市面上的鞋很少,脚也没得选。就算穿得不舒服,也只能凑合穿,也就是“鞋决定脚”;但是随着市场发展,卖鞋的商家越来越多,最终就会变成买方市场——谁更了解脚,才能做出最舒服的鞋,才能卖得更好,也就是“脚决定鞋”。

同样的道理,不管是L4公司,还是传统域控厂商,只有足够了解智能驾驶的使用场景和智能驾驶算法及软件,才能更好地设计硬件;也只有对智能驾驶有了深刻的理解,才能打造更适合智能驾驶的域控制器。

参考资料

1. 加速小马智行自动驾驶汽车传感器数据处理流水线https://zhuanlan.zhihu.com/p/521019988

2. Accelerating In-Vehicle GPU Computing, from Sensing to Inference  https://www.nvidia.cn/on-demand/session/gtcspring22-s41879/

 

 

参考文献链接

https://mp.weixin.qq.com/s/aY4ZPNBMjfQIklq2foWzyw

https://mp.weixin.qq.com/s/DDJdr9JR67HzfOp05USDQA

https://mp.weixin.qq.com/s/3kffmLpuHdMMKOXRYhrgQQ

posted @ 2022-07-28 05:46  吴建明wujianming  阅读(898)  评论(0编辑  收藏  举报