从技术视角谈谈自动驾驶的必经之路(转)

汽车产业革命上半场电动化,下半场智能化已是行业共识,但让人始料未及的是,半场间的切换来得如此猝不及防。

由于技术复杂性、商业可行性以及监管挑战等将自动驾驶汽车成为主流的时间一再推迟。对于什么时间、什么方式去实现自动驾驶,业内尚未统一观点,于自动驾驶产业链上的各家企业而言,汽车智能化仍是一个远大前程与至暗时刻并存的灰色时期。

在今天这样一个大浪淘沙的变革时代,机遇和风险并存,一切都有可能,充满了很多不确定性,我们来谈谈自动驾驶的必经之路和技术陷阱。

01

感知与决策

自动驾驶汽车能够使用自然语言处理技术来阅读路标内容。检测物体(车道、行人、自行车、动物、碎片、其他车辆等等)是更加复杂的任务。训练人工智能从一个角度检测物体的成本是很高的,并且需要大量数据。人工智能实际使用的数据是物体的边缘,前者通过训练来检测各种模式,直到达到所需的准确率为止。

感知算法模块存在问题:

  • 2D图像语义分割、3D目标检测、3D语义分割的精度下降

    • 训练样本数量偏少

    • 高的标注成本

    •  不平衡的训练数据

    •  不完整的场景覆盖

  •  模型不可解释、需要大量的数据、训练过程不可控、鲁棒性不够

     

  •  多传感器融合的耦合性较高,真正异构的多传感器融合比较少

     

  •  没有全天候,全场景的覆盖研究

    • 雨天、雪天、雾天

    •  山路、乡村路、冰雪路

       

  •  对高动态的场景缺少在线验证的方法,无法评估正确性与稳定性

     

规划与决策存在问题:

  • 环境感知系统不太准确,导致预测模块(意图与轨迹)结果不准确,导致自车与目标博弈算法失败,使得决策系统更倾向于保守的规则(停车)

    • 比如评估当前场景变化莫测,系统很难避障,系统就会选择停车
    • 如果与后车间距又太小,就会一直等着,直到前方可通行
  • 根据划分力度的不同,会造成场景的数量不断的增加

    • 几百万到几千万量级都是有可能的,无法去评估
  • 超低速情况也是一个主要挑战

    • 车辆设计都会有一个待速的要求,如果低于这个速度了可能会熄火,尤其是内燃机这种车
    • 在待速情况下很难走出预先设定的轨迹,不够细腻,造成避障与会车的失败
    • 人由于在驾驶可以含着刹车,并且开车处于不断试探的过程,可以不断博弈,而自动驾驶就无法很好的cover
  • 决策的伦理性和责任认定还不成熟

 

根据波兰尼悖论,某些技能(例如骑自行车、下棋和围棋以及驾驶汽车)不适合通过指令来学习。当 AV 检测到一个物体时,只有在你能够预测所有可能场景的情况下,用来响应这个物体的编程规则才能真正行之有效。但为所有可能的情况编写规则太复杂了。于是自动驾驶汽车会从经验中学习如何自己做决策和导航。

  •  一种选择是让 AV 学习如何通过模拟训练来做决策

    •  截至 2020 年,Waymo(前身为谷歌自动驾驶汽车项目,它是 Alphabet 的子公司)已经模拟了 150 亿英里的行驶里程,其中真实里程仅为 2000 万英里

    •  通过模拟训练,自动驾驶汽车可以获得更多经验并更好地了解它们可能遇到的各种可能场景 

    • 不幸的是,由于训练人工智能的数据与现实世界中的数据之间存在差异,机器学习过程无法判断模拟训练中使用的哪些模型在真实世界中是行之有效的

       

  •  另一种选择是在政府指定的自动驾驶汽车试验场上测试汽车

    • 这些试验场有定制的高速公路、停车场、十字路口和通信网络,车辆通过这些网络相互“对话”并与基础设施“对话”

    • AI 软件、底层处理硬件和传感器负责 AV 的决策

       


 

02

数据处理和通信

今天的大多数数据处理技术都使用了冯诺依曼架构,其中数据存储器和处理器位于两个不同的位置,发展到现在就是流行的云计算技术。当摄像头和传感器检测道路上的物体并生成数据时,处理器需要快速分析数据并就加速、制动和转向操作做出实时决策。但是这种能力会受到延迟问题的影响。

解决延迟的一种方案是将处理和数据存储转移到更靠近需要改善响应时间的位置。例如,边缘计算技术将处理器放置在生成数据的位置。大多数新型人工驾驶车辆会包含 30 到 100 个电子控制单元(ECU),用于处理数据并控制车辆中的电气系统。这些嵌入式系统(通常位于仪表板中)控制多种应用,例如安全气囊、转向、制动器等。ECU 负责处理由 AV 中的摄像头和传感器生成的数据,并对车辆的运行方式做出关键决策。

由于通信有时会不可靠,AV 还会利用传感器融合或冗余预防系统出现单点故障。例如,如果汽车的传感器出现故障,它还可以依靠 GPS 技术来安全导航。与使用群体智能的细菌、鱼类和鸟类类似,自动驾驶汽车也可以通过相互通信来改善导航决策。研究人员目前正在研究雾计算方法,这种方法将服务器放置在高速公路上,以实现更快、更可靠的导航和通信数据分析。与云相比,雾更加靠近地面,这也是雾计算的名称来源。

解决延迟的另一种方案是寄希望于存算一体化技术。存算一体技术(PIM :Processing in-Memory)被视为人工智能创新的核心。它将存储和计算有机结合,直接利用存储单元进行计算,极大地消除了数据搬移带来的开销,解决了传统芯片在运行人工智能算法上的“存储墙”与“功耗墙”问题,可以数十倍甚至百倍地提高人工智能运算效率,降低成本。

但从消费级到企业级市场的应用普及,可能需要十年甚至更长的时间来扎实基础,升级完善。当前,存算一体化芯片研发还需要面临可靠性和密度问题,需要更多的技术验证和行业实践应用:

  •  技术层面:存算一体芯片涉及器件-芯片-算法-应用等多层次的跨层协同

  •  细分应用场景的不同性能需求决定了神经网络算法与芯片的设计,算法依赖神经网络框架、编译、驱动、映射等工具与芯片架构的协同,芯片架构又依赖器件、电路与代工厂工艺 

  • 器件物理原理、行为特性、集成工艺都不尽相同,需要跨层协同来实现性能(精度、功耗、时延等)与成本的最优

  • 产业生态层面:作为一种新兴技术,想要得到大规模普及,离不开产业生态的建设,需要得到芯片厂商、软件工具厂商、应用集成厂商等的大力协同、研发、推广与应用,实现性能与场景结合与落地

     

03 电池和充电系统

电动交通的形式已经越来越多样化。并在全球可持续发展的大背景下扮演着重要角色。从电动自行车、汽车到无人驾驶电动汽车、Robotruck,再到自动驾驶无人机,这些产品似乎都在显露着未来的某种趋势。

来自加拿大安大略理工大学的Williamson教授认为,电动交通商业化的进一步成功,以及未来的全自动驾驶技术,将取决于电力电子技术的进步。

这种技术在未来几年面临着许多挑战,特别是在电能存储系统的控制和智能充电系统的发展方面。

为了让电动汽车(EV)大规模普及,研究人员必须设法让电池更便宜、更轻,并增加其能提供的续航里程。大多数电池提供的续航里程约 200-260 英里,而特斯拉 Model S 的续航里程达到了 370 英里,代价是其锂离子电池组的重量达到了 1,200 磅。因此,电动汽车一方面要面对电池价格和重量之间的权衡,另一方面小电池还需要更频繁的充电。

研究人员正在研究几种替代方案。更换电池方案太昂贵且不切实际。为 EV 充电需要电缆,而对于 AV 来说,还需要机器人或人类将电缆插入汽车和充电站。固态电池可以存储更多能量、充电更快,但它们仍在开发中。

研究人员还在研究更高效的电池充电方式。无线充电系统提供了一些优势。它们将减少 EV 对充电站和电池组容量的需求,这也能降低车辆的成本和重量。电能无线传输需要两个电磁线圈,其中一个线圈位于地面并连接到电源,另一个线圈安装在车辆中,与车辆的充电系统和电池相连。能量通过两个线圈之间的磁场传递。该技术仍在开发中,因为磁线圈之间的能量传输效率还不够理想。

谷歌和高通正在开发一种系统,可以在高速公路上嵌入充电线圈条,让汽车可以在行驶时充电:

  •  高通已经证明,即使车辆以 70 英里 / 小时的速度行驶并且表面被水覆盖,也可以在行驶中充电

  •  使用这种方法时电池就用不着充电了,因为在路上行驶时不会消耗电池电量

  •  这将消除人们对 EV 续航里程的担忧,并可能让电力成为汽车的标准能源

  •  然而,人类长期暴露于弱磁场中时身体健康受到的影响目前尚不清楚。因此需要在这方面进行更多的研究以确保人身安全

     

04 公众接受度

人类驾驶员和自动驾驶汽车都会遇到需要做出生死攸关决策的情况。例如,紧急情况下自动驾驶汽车应该转向撞死行人,还是什么都不做,结果导致自己搭载的乘客死亡呢?

麻省理工学院计算机科学家 Iyad Rahwan 通过一个名为 Moral Machine 的交互式网站对参与者进行了关于不同情景下道德困境的调查。该项目吸引了来自 233 个国家和地区的超过 200 万参与者,他们代表不同的宗教、国家和文化。研究发现。

尽管许多研究人员认为,从长远来看,由于人为错误减少,自动驾驶汽车最终会变得更安全,但 2018 年路透社 / 益普索的一项民意调查表明,社会还没有准备好大规模推广自动驾驶汽车。在不具备关于自动驾驶汽车的经验或知识的情况下,只有 27% 的受访者(38% 的男性和 16% 的女性)表示他们会觉得乘坐无人驾驶汽车很舒服。虽然年轻的受访者通常对自动驾驶汽车更感兴趣,但54% 的司机认为与它们共享道路会让自己感到不够安全。

监管部门正在评估人工智能在高速公路上能有多大程度的自主决策权。SAE International 设计了一套 系统,将驾驶自动化级别分为 0 到 5 级。目前,自动驾驶汽车基本上都有学习许可证,但在允许自动驾驶汽车在没有辅助的情况下自主在道路上行驶之前,它们必须先获得公众的认可。

 

自动化水平
0 级:没有自动化能力。驾驶系统可能暂时接管车辆控制功能——例如防抱死制动和电子稳定控制——但不能持续控制车辆。
1 级:驾驶员辅助。具备一些辅助功能,例如自动巡航控制和停车辅助。
2 级:部分自动化。驾驶员需要一直监控汽车,但在某些驾驶条件下无需手动转向、制动或加速。
3 级:有条件的自动化。车辆在大部分情况下都可以自动驾驶,但驾驶员必须时刻保持警惕,以便根据需要接管控制权。
4 级:高度自动化。车辆可以完全自主运行,但这仅限于特定的道路或条件。
5 级:全自动化。车辆可以完全自主运行,无需任何人类驾驶员干预。

 

随着 2 级自动驾驶汽车进入高速公路,与人类驾驶员一起行驶并获取经验,它们也偶尔会发生碰撞事故。美国国家运输安全委员会(NTSB)发布了两起使用了 Autopilot 功能的特斯拉汽车遭遇的致命事故的最终报告。该机构确定事故的主要原因与特斯拉无关,但特斯拉的自动驾驶功能是一个事故促成因素——过度依赖自动化导致驾驶员注意力不集中、反应迟钝。

 

05 算力堆不出自动驾驶

行业需要思考一个问题是:在“软件定义汽车”的情况下,解决智能驾驶系统计算平台的支撑问题,是否只能通过算力堆叠来实现?

笔者认为:提升硬件很重要,但不能陷入“唯算力论”的怪圈。

自动驾驶芯片的竞争壁垒在于算力利用率和可用性。算力不能说无限增长,芯片PPA(功耗、成本和面积)都是很要命的。对于车载AI芯片来说,算力指标重要,能效比更重要。

以英伟达的芯片为例,它GPU的功耗是最高的。Orin、Xavier的利用率基本上是30%。不同于英伟达的GPU方案,高通、mobileye、华为,包括国内这些创业公司都走的是ASIC路线。ASIC芯片针对不同的神经网络模型去优化,基本上可以做到60%~80%之间,好一点的可能会做到80%再高一些。

芯片算力的无限膨胀和硬件预埋不会是未来的趋势。此外,车企面对的消费端是不是立刻就需要那么高端的算力呢?也不见得。自动驾驶算力主要是体现在感知层面的融合,对于L3 100~200已经够了,对于L4可能需要200~300,更关键是怎么用算力,不是说越多越好,如果要做1000,其实是没有必要,并且高算力背后高功耗和低利用率问题愈发严重。

 

06 车路协同是伪命题

从技术和成本在车侧和路侧的分配出发,自动驾驶的发展演化出三条技术路线:

  • 以激光雷达和高精地图为代表的“谷歌派”单车智能路线

  • 以视觉感知和影子模式为代表的“特斯拉派”单车智能路线

  • 在网联化方面率先发力与突破的车路协同路线

不同于单车智能,车路协同更多追求车辆与周遭事物的互联来实现自动驾驶。再加上5G 概念(更快的峰值网络传送速率能让通讯更快捷)加持,通过车路协同来实现自动驾驶似乎更可期了,但现实似乎并非如此。


技术操作上,一个比较现实的问题是,车路协同并不是所有的区域都能做,比如农村。如果要大量铺设支持车路协同的智能化基础设施,明显不经济。而且国外是否接受这种路线,并大规模铺设相关的基础设施,也存在极大的不确定性。

站在车企角度,单车智能显然更为重要。对车厂来说,开发的汽车显然不能只适用于特定区域——除非是专门研发特定用途汽车的企业,而应该同时满足城市、乡村、国内、国外等多个不同市场的需求。过于依赖车路协同,无疑是自我束缚

此外,有很多地方即便有智慧公路,可以收集到大量数据,却面临数据不知道如何处理的问题,路端传感器如何布置也没有形成统一标准:

 

  • 比如交通信号灯,就有很多种品牌,不同的品牌有不同的协议标准,有的甚至是黑匣子不公开标准,或者没有标准

  • 一条路上不同的传感器在相近的时间里可能会监测出不同结果,如何对这些差别做验证和取舍,也得有具体的标准

  • 不同的地方政府、合作方基于自身原有的技术标准,也会有不同的要求

     

从 商业运营上看车路协同是一个伪需求 ,商业模式走不通一公里的改造费用6个亿人民帀 , 这个钱政府可以出 , 但是做了这条路 , 不能要求主机厂去装—个2000-3000块钱的OBU 。 为了所谓的车路协同 , 增加每个车的成本2000-3000政府的基建 , 要做这个路 , 车路协同的设备 , 做完了就完了 , 但是没人跟 。

根据《2020年交通运输行业发展统计公报》,截至2020年末,全国公路总里程519.81万公里,其中四级及以上等级公路里程494.45万公里,二级及以上等级公路里程70.24万公里。国道里程37.07万公里,省道里程38.27万公里。农村公路里程438.23万公里,其中县道里程66.14万公里、乡道里程123.85万公里、村道里程248.24万公里。

考虑到农村公路往往限速较低、车流稀少,除交叉路口外,配置车路协同感知系统的必要性不大,可先只考虑二级及以上等级公路或国省干线,总里程约70万公里。倘若按照高速公路的标准,为之铺设感知系统,考虑到弯道及隧道等特殊情况,按每100米一个点位配置(大部分国省干道可只设单侧感知),则每公里投资约为50万,则全国范围国省干道感知网络建设成本约为3500亿。

据一位业内专家的经验,每1公里道路,安装路侧感知设备成本在150万元~200万元之间,这还未算上数据平台、车端设备的改造。无锡锡山区车联网小镇上,仅两条道路,车路协同建设造价就过亿元,这还不过是冰山一角。整个小镇建设范围涵盖37km路网、63个网联路口、13km公共测试道路,总投资约120亿元。

与迟迟不能取得商业化进展的Robotaxi相比,动辄亿元订单的“造富”效应,也让车路协同多了一份关注度。

在全国近千公里的测试路段上,你几乎找不到一辆连有车路协同设备的私家车。车路协同付费方还停留在B端和G端,未曾渗透到终端用户层面。很显然,B端和G端不会是大头的买单方——每公里上百万元的建设费,只有摊派到每辆车上,才算得过来经济账。

过去几年,政府在路端率先迈出改造的第一步后,如果终端不愿意大规模买单,不能配合跟上建设步伐,那么政府算不来经济账,势必推不动进一步建设。反过来,如果没有大规模车路协同基建设施,消费者不会产生足够刚性的需求,就不会有动力买单。

车路协同更多的是解决路权分配的问题,把大数据流量和车链接起来就可以,没有必要做得那么复杂,重点还是依赖于车端。

07

单车智能“谷歌派”,以激光雷达为主要感知设备,采取了激光雷达、毫米波雷达、摄像头等多传感器融合的方案。

特斯拉利用影子模式(Shadow-Mode)训练与迭代其自动驾驶算法,将已售车辆变为“测试车辆”,不断收集现有活跃车辆的真实场景数据,上报捕捉到的视觉信息与“稀有案例”,并基于模型对外界进行预判。庞大的特斯拉车队活跃在北美、欧洲和东亚,为特斯拉建立了庞大的数据库,修正和完善了自动驾驶算法。

纯视觉方案存在部分问题难以通过单纯的算法提升而弥补。比如测距精度有限、对于强光场景处理难度大、视野范围有限、摄像头机械稳定性差等。这些问题使得使用包括激光雷达、摄像头、毫米波在内的多传感器融合的方案更有优势。

未来主流自动驾驶解决方案,笔者认为将会融合摄像头、激光雷达、毫米波、超声波等多种传感器,激光雷达的融合将会更好的应对各种突发情况,而车路协同因为技术可操作性和商业模式问题,注定走向淘汰。

单车智能还远远没有达到其顶峰,在物理规则之内,我们有理由相信没什么是目前看起来单车智能攻克不了,而必须要通过V2X来解决。对于自动驾驶甚至无人驾驶,车路协同是锦上添花的事情,单车智能才是必经之路。

posted @ 2022-07-21 11:36  K_Code  阅读(318)  评论(0编辑  收藏  举报