摘要: **发表时间:**2021 **文章要点:**这篇文章有点长,主要是说训练了一个2v2的足球,使得运动方式拟人化,同时产生了合作和配合。方法上来说,分成三个阶段,第一个阶段用监督学习(imitation learning)的方式学习基本的拟人化运动方式,比如站立,走路,奔跑之类的;第二个阶段用强化的 阅读全文
posted @ 2021-07-27 13:26 initial_h 阅读(197) 评论(0) 推荐(0) 编辑