2020 年 11月 5 日随笔档案 - my灬king

公告

2020年11月5日

稀疏奖励及模仿学习

摘要：一、稀疏奖励实际上用 reinforcement learning learn agent 的时候，多数的时候 agent 都是没有办法得到 reward 的。那在没有办法得到 reward 的情况下，训练 agent 是非常困难的。如果环境中的 reward 非常 sparse，reinforc 阅读全文

posted @ 2020-11-05 23:32 my灬king 阅读(251) 评论(0) 推荐(0) 编辑