摘要: 本文首发于:行者AI 在多agent的强化学习算法中,前面我们讲了QMIX,其实VDN是QMIX的一个特例,当求导都为1的时候,QMIX就变成了VDN。QTRAN也是一种关于值分解的问题,在实际的问题中QTRAN效果没有QMIX效果好,主要是QTRAN的约束条件太过于松散,导致实际没有理论效果好。但 阅读全文
posted @ 2021-06-23 15:15 行者AI 阅读(562) 评论(0) 推荐(0) 编辑