摘要:
1. MDP的最佳策略是确定性和无记忆的,一错会再错,以前发生的状态也不记得。Memory模块是正解吗? 图源 https://zhuanlan.zhihu.com/p/430221668 2. 毫末 吕迪 对于RL现存问题的看法 每个观点都很insight 强化学习领域目前遇到的瓶颈是什么? - 阅读全文
摘要:
来源:如何理解Tesla和Wayve在CVPR2023 workshop上提到的world model? - EatElephant的回答 - 知乎 https://www.zhihu.com/question/610849510/answer/3108529249 “CVPR 2023 自动驾驶w 阅读全文
摘要:
最近着重看了一些端到端的自动驾驶方案,有一些想法 特点: 1.表现好,Carla leaderboard榜首几乎都是E2E,比如TCP,Transfuser, LAV2.逐渐偏重模块化的精细设计,并且中间量可以decode来可视化用以增强可解释性3.很多用GRU生成/refine轨迹,考虑waypo 阅读全文
摘要:
1.关于anchor的理解 先看在目标检测领域的anchor的含义:https://www.zhihu.com/question/42205480/answer/155759667;https://zhuanlan.zhihu.com/p/84398108 最早用anchor的可能是Faster R 阅读全文
摘要:
摘要:提出了一个新的方法,把目标检测看作直接的集合的预测问题。消除了很多其他方法需要的手工设计的先验的环节,比如非极大抑制、anchor设计等。DETR是什么?DEtection TRansformer, 重要元素包含两项:基于集合的全局损失函数(用二部匹配进行唯一预测)以及一个transforme 阅读全文
摘要:
有段时间之前读的文章了,师兄推荐的,感觉挺好的,讲的是状态和动作的设计方式 1 表示车辆 1.1 Encodings 1.1.1 连续坐标系 每辆车的状态用位置、车头朝向和速度表示: 则所有车(N个)状态的集合描述了道路交通的复合状态: 参考系可以是绝对的,但是通常采用ego-centric,以自车 阅读全文
摘要:
摘要:看看RL怎么用在motion planning和control上。【读的时候没注意,才10引用,果然不太行】 1.INTRODUCTION 有监督学习每个任务都要一大堆标注数据,costly。而且不能覆盖所有复杂场景。RL没有以上两种缺点。 决策和控制上使用的RL方法,分两类:分层方法(pip 阅读全文
摘要:
有一篇可以参考的https://blog.csdn.net/u011841848/article/details/123173791 这篇文章代码在https://github.com/HKUST-Aerial-Robotics/spatiotemporal_semantic_corridor,有空 阅读全文