自动驾驶端到端,到底到了哪个端口?
最近读一些端到端的文章,发现一个问题,现在所谓的端到端,其实远远没有端到端。
从最开始的传感器端到端,这样做有两个好处,1.把跟踪和检测合为一体。2.把后处理的很多tricks拿到模型上来做了,感知模型实际输出就是物体的世界坐标位置。这种文章又分两个大方向,一个是密集dense类型的,比如bevfomer类似的,一个是sparse类型的,比如streampetr这种。但是这种端到端,只是视觉感知(也有视觉和lidar融合的,比如bevfusion等)实现了端到端。也就是司机开车时,眼观的东西,具体这个看到的东西怎么帮助进行驾驶,还没有涉及到。
那么后来又出来端到端,比如sparsedrive, UniAD等,其实这些端到端只是到了路径规划的部分,并没有实现所谓的端到端,也就是缺少了车辆控制环节。
真正的端到端,其实要包括车辆控制的环节,现在相当于规控部分完成了一半,离端到端还有距离。当然也有厂家宣传说用大模型实现了真正的端到端,也就是包括了控制部分,但是看到框架介绍,好像控制部分真正包含在内的还是不多的。
所以做规控的同志们也不需要过于紧张,还有学习的时间。但是做传统后处理的同学们可能就要加快步伐了,因为各大厂家都上了感知器的端到端,那些烦人的后处理没有了,就必然面临一个问题,那就是之前的经验会有贬值,需要技术更新了。
但是做规控的同学们,控制这块看介绍七八年前就是用强化学习来做的,不知道现在有没有很大突破,一起学习起来。
Sophie的世界,转载请注明出处,谢谢。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· winform 绘制太阳,地球,月球 运作规律
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
2015-09-10 十一旅行