稀疏奖励及模仿学习
摘要:
一、稀疏奖励 实际上用 reinforcement learning learn agent 的时候,多数的时候 agent 都是没有办法得到 reward 的。那在没有办法得到 reward 的情况下,训练 agent 是非常困难的。如果环境中的 reward 非常 sparse,reinforc 阅读全文
posted @ 2020-11-05 23:32 my灬king 阅读(249) 评论(0) 推荐(0) 编辑