摘要: 1. MDP的最佳策略是确定性和无记忆的,一错会再错,以前发生的状态也不记得。Memory模块是正解吗? 图源 https://zhuanlan.zhihu.com/p/430221668 2. 毫末 吕迪 对于RL现存问题的看法 每个观点都很insight 强化学习领域目前遇到的瓶颈是什么? - 阅读全文
posted @ 2023-09-12 18:56 Zer0_Chambers 阅读(17) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2023-08-10 01:45 Zer0_Chambers 阅读(4) 评论(0) 推荐(0) 编辑
摘要: 来源:如何理解Tesla和Wayve在CVPR2023 workshop上提到的world model? - EatElephant的回答 - 知乎 https://www.zhihu.com/question/610849510/answer/3108529249 “CVPR 2023 自动驾驶w 阅读全文
posted @ 2023-08-08 12:59 Zer0_Chambers 阅读(297) 评论(0) 推荐(0) 编辑
该文被密码保护。 阅读全文
posted @ 2023-03-01 17:44 Zer0_Chambers 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 最近着重看了一些端到端的自动驾驶方案,有一些想法 特点: 1.表现好,Carla leaderboard榜首几乎都是E2E,比如TCP,Transfuser, LAV2.逐渐偏重模块化的精细设计,并且中间量可以decode来可视化用以增强可解释性3.很多用GRU生成/refine轨迹,考虑waypo 阅读全文
posted @ 2023-02-17 19:02 Zer0_Chambers 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 1.关于anchor的理解 先看在目标检测领域的anchor的含义:https://www.zhihu.com/question/42205480/answer/155759667;https://zhuanlan.zhihu.com/p/84398108 最早用anchor的可能是Faster R 阅读全文
posted @ 2022-11-10 03:30 Zer0_Chambers 阅读(640) 评论(0) 推荐(0) 编辑
摘要: 摘要:提出了一个新的方法,把目标检测看作直接的集合的预测问题。消除了很多其他方法需要的手工设计的先验的环节,比如非极大抑制、anchor设计等。DETR是什么?DEtection TRansformer, 重要元素包含两项:基于集合的全局损失函数(用二部匹配进行唯一预测)以及一个transforme 阅读全文
posted @ 2022-10-19 14:11 Zer0_Chambers 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 有段时间之前读的文章了,师兄推荐的,感觉挺好的,讲的是状态和动作的设计方式 1 表示车辆 1.1 Encodings 1.1.1 连续坐标系 每辆车的状态用位置、车头朝向和速度表示: 则所有车(N个)状态的集合描述了道路交通的复合状态: 参考系可以是绝对的,但是通常采用ego-centric,以自车 阅读全文
posted @ 2022-10-09 20:08 Zer0_Chambers 阅读(93) 评论(0) 推荐(0) 编辑
摘要: 摘要:看看RL怎么用在motion planning和control上。【读的时候没注意,才10引用,果然不太行】 1.INTRODUCTION 有监督学习每个任务都要一大堆标注数据,costly。而且不能覆盖所有复杂场景。RL没有以上两种缺点。 决策和控制上使用的RL方法,分两类:分层方法(pip 阅读全文
posted @ 2022-10-09 19:42 Zer0_Chambers 阅读(78) 评论(0) 推荐(0) 编辑
摘要: 有一篇可以参考的https://blog.csdn.net/u011841848/article/details/123173791 这篇文章代码在https://github.com/HKUST-Aerial-Robotics/spatiotemporal_semantic_corridor,有空 阅读全文
posted @ 2022-09-26 22:07 Zer0_Chambers 阅读(1205) 评论(0) 推荐(0) 编辑