摘要:
虚拟机上配置Apollo_CPU环境 一、配置Ubuntu系统 vmware16: 链接:https://pan.baidu.com/s/1DmEy3IO4i56W7m-x4H0tUA 提取码:gfjk ubuntu18.04.6: 链接:https://pan.baidu.com/s/1_vqSU 阅读全文
摘要:
在学习智能网联汽车技术(崔胜民著)一书时,在P22页看到一句*“充满杂波的外部环境经常给毫米波雷达感知带来虚警问”*,但是书中没有详细展开,这里来补充一下。 毫米波雷达是工作在毫米波频段的雷达,它通过发射与接收高频电磁波来探测目标,后端信号处理模块利用回波信号计算出目标的距离、速度和角度等信息。虚警 阅读全文
摘要:
上一篇文章介绍了策略评估的方法,并且证明了其收敛性,本篇文章在其基础上证明策略迭代、策略提升和价值迭代,并且介绍格子世界的例子 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from= 阅读全文
摘要:
上一篇文章推导了贝尔曼方程,这一篇文章来继续分享对应的马尔可夫决策的案例,然后引入策略评估并证明其收敛性。 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from=333.999.0. 阅读全文
摘要:
我们在上一篇文章中详细推导了马尔可夫奖励过程的贝尔曼公式,这一篇文章重点来推导马尔科夫决策过程的贝尔曼公式。 主要的学习资源是四个: B站许志钦老师的视频(主要入门理论)https://www.bilibili.com/video/BV15a4y1j7vg?spm_id_from=333.999.0 阅读全文
摘要:
博客园用markdown语法写的第一篇文章,在这里非常感谢 小么VinVin对我的帮助。 我先在这里分享一下写强化学习的原因。大三上学期,学院开设了智能车辆规划与决策课程,由于学时的限制,最后决策部分的内容只讲了有限状态机和马尔可夫决策。我利用寒假这段时间,继续补充了强化学习方面的知识,大三下学期这 阅读全文