摘要: 虚拟机上配置Apollo_CPU环境 一、配置Ubuntu系统 vmware16: 链接:https://pan.baidu.com/s/1DmEy3IO4i56W7m-x4H0tUA 提取码:gfjk ubuntu18.04.6: 链接:https://pan.baidu.com/s/1_vqSU 阅读全文
posted @ 2022-03-11 11:14 静候佳茵 阅读(496) 评论(0) 推荐(0) 编辑
摘要: 在学习智能网联汽车技术(崔胜民著)一书时,在P22页看到一句*“充满杂波的外部环境经常给毫米波雷达感知带来虚警问”*,但是书中没有详细展开,这里来补充一下。 毫米波雷达是工作在毫米波频段的雷达,它通过发射与接收高频电磁波来探测目标,后端信号处理模块利用回波信号计算出目标的距离、速度和角度等信息。虚警 阅读全文
posted @ 2022-03-06 15:19 静候佳茵 阅读(742) 评论(0) 推荐(0) 编辑
摘要: 上一篇文章介绍了策略评估的方法,并且证明了其收敛性,本篇文章在其基础上证明策略迭代、策略提升和价值迭代,并且介绍格子世界的例子 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from= 阅读全文
posted @ 2022-03-05 10:49 静候佳茵 阅读(108) 评论(0) 推荐(0) 编辑
摘要: 上一篇文章推导了贝尔曼方程,这一篇文章来继续分享对应的马尔可夫决策的案例,然后引入策略评估并证明其收敛性。 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from=333.999.0. 阅读全文
posted @ 2022-02-28 16:09 静候佳茵 阅读(517) 评论(0) 推荐(0) 编辑
摘要: 我们在上一篇文章中详细推导了马尔可夫奖励过程的贝尔曼公式,这一篇文章重点来推导马尔科夫决策过程的贝尔曼公式。 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from=333.999.0 阅读全文
posted @ 2022-02-25 18:30 静候佳茵 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 博客园用markdown语法写的第一篇文章,在这里非常感谢 小么VinVin对我的帮助。 我先在这里分享一下写强化学习的原因。大三上学期,学院开设了智能车辆规划与决策课程,由于学时的限制,最后决策部分的内容只讲了有限状态机和马尔可夫决策。我利用寒假这段时间,继续补充了强化学习方面的知识,大三下学期这 阅读全文
posted @ 2022-02-23 15:02 静候佳茵 阅读(223) 评论(0) 推荐(1) 编辑