2022 年 7月 14 日随笔档案 - climerecho - 博客园

2022年7月14日

强化学习-学习笔记15 | 连续控制

摘要：

强化学习-学习笔记15 | 连续控制

本系列的完结篇，介绍了连续控制情境下的强化学习方法，确定策略 DPG 和随机策略 AC 算法。阅读全文

posted @ 2022-07-14 21:27 climerecho 阅读(1111) 评论(0) 推荐(1) 编辑