摘要:
有段时间之前读的文章了,师兄推荐的,感觉挺好的,讲的是状态和动作的设计方式 1 表示车辆 1.1 Encodings 1.1.1 连续坐标系 每辆车的状态用位置、车头朝向和速度表示: 则所有车(N个)状态的集合描述了道路交通的复合状态: 参考系可以是绝对的,但是通常采用ego-centric,以自车 阅读全文
摘要:
摘要:看看RL怎么用在motion planning和control上。【读的时候没注意,才10引用,果然不太行】 1.INTRODUCTION 有监督学习每个任务都要一大堆标注数据,costly。而且不能覆盖所有复杂场景。RL没有以上两种缺点。 决策和控制上使用的RL方法,分两类:分层方法(pip 阅读全文