深度强化学习:Policy-Based methods、Actor-Critic以及DDPG
摘要:
本文介绍了基于策略的强化学习方法,将基于价值和基于策略结合起来的Actor-Critic框架,以及使用Actor-Critic这一框架的DDPG算法 阅读全文
posted @ 2019-07-15 15:05 sunwq06 阅读(2459) 评论(0) 推荐(0) 编辑
posted @ 2019-07-15 15:05 sunwq06 阅读(2459) 评论(0) 推荐(0) 编辑