摘要: DDPG原理和算法 DDPG原理和算法 背景描述 DDPG的定义和应用场景 PG DPG DDPG DDPG算法相关基本概念定义 DDPG实现框架和算法 DDPG对于DPG的关键改进 以下用RL作为Reinforcement Learning的简称。 背景描述 概括来说,RL要解决的问题是:让age 阅读全文
posted @ 2020-09-30 09:20 xlchan 阅读(6321) 评论(0) 推荐(2) 编辑