摘要: **发表时间:**2021(ICLR 2021) **文章要点:**这篇文章用角色(roles)来分解复杂任务,解决多智能体问题。主要思路是根据动作对环境和其他agents的影响来分解动作空间,形成不同的角色动作空间(role action space),然后通过role selector来给age 阅读全文
posted @ 2021-11-17 13:45 initial_h 阅读(258) 评论(0) 推荐(0) 编辑
摘要: **发表时间:**2019(ICLR 2019) **文章要点:**这篇文章主要是想学习人类的控制策略,并且能够重复使用。主要思路就是通过监督学习去学一个叫做neural probabilistic motor primitives的模型。这个模型包括一个encoder和一个decoder 这里$s 阅读全文
posted @ 2021-11-17 13:37 initial_h 阅读(109) 评论(0) 推荐(0) 编辑