2020 年 9月 30 日随笔档案 - xlchan

2020年9月30日

摘要： DDPG原理和算法 DDPG原理和算法背景描述 DDPG的定义和应用场景 PG DPG DDPG DDPG算法相关基本概念定义 DDPG实现框架和算法 DDPG对于DPG的关键改进以下用RL作为Reinforcement Learning的简称。背景描述概括来说，RL要解决的问题是：让age 阅读全文

posted @ 2020-09-30 09:20 xlchan 阅读(6321) 评论(0) 推荐(2) 编辑

Jeffrey X.L. Chan

公告