2021 年 6月 23 日随笔档案 - 行者AI

2021年6月23日

摘要：本文首发于：行者AI 在多agent的强化学习算法中，前面我们讲了QMIX，其实VDN是QMIX的一个特例，当求导都为1的时候，QMIX就变成了VDN。QTRAN也是一种关于值分解的问题，在实际的问题中QTRAN效果没有QMIX效果好，主要是QTRAN的约束条件太过于松散，导致实际没有理论效果好。但阅读全文

posted @ 2021-06-23 15:15 行者AI 阅读(562) 评论(0) 推荐(0) 编辑

行者AI

为游戏插上人工智能的翅膀

公告