2023 年 3月 22 日随笔档案 - deephub

2023年3月22日

摘要：深度确定性策略梯度(Deep Deterministic Policy Gradient, DDPG)是受Deep Q-Network启发的无模型、非策略深度强化算法，是基于使用策略梯度的Actor-Critic，本文将使用pytorch对其进行完整的实现和讲解 DDPG的关键组成部分是 Repla 阅读全文

posted @ 2023-03-22 10:51 deephub 阅读(227) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

公告