摘要: 基于策略相似度的零样本协调表现改进 总结: 这篇论文本质上是研究智能体的泛化性能,文中涉及的问题是在一个常规多智能体系统中的智能体如果要与新加入的或者说没有交互过的智能体一起训练的协调能力比较差,从而导致合作程度不够影响收益。文章针对这个问题先是研究了影响智能体协调能力的参数之后利用该参数采取特殊的 阅读全文
posted @ 2023-02-24 19:19 lanthanume 阅读(55) 评论(0) 推荐(0) 编辑