2023 年 5月 19 日随笔档案 - lee_ing

2023年5月19日

May 2022-Composite Experience Replay-Based Deep Reinforcement Learning With Application in Wind Farm Control

摘要：设计了一种新的复合体验重放(CER)策略，并将其嵌入到深度确定性策略梯度(DDPG)算法中。CER提供了一种新的采样方案，**通过在奖励和时间差异(TD)误差之间进行权衡，可以深入挖掘存储变迁的信息阅读全文

posted @ 2023-05-19 17:35 lee_ing 阅读(24) 评论(0) 推荐(0) 编辑

Jan 2022-Actor-critic with familiarity-based trajectory experience replay

摘要：摘要：深度强化学习通过智能体与环境进行交互获取原始输入信息，从而学习动作策略，通过不断地试错逐步形成具有强大学习能力的智能体。本文旨在解决深度强化学习中著名的异步优势行动者评论家算法A3C样本效率低下的问题。首先，设计了一种新的离策略actor-critic算法，该算法在在策略actor-crit 阅读全文

posted @ 2023-05-19 11:52 lee_ing 阅读(49) 评论(0) 推荐(0) 编辑

Lee_ing

公告