《The Importance of Credo in Multiagent Learning》 2022-AAMAS(未被收录)
奖励成分在多智能体学习中的重要性
总结:
探索智能体的奖励结构成分对多智能体系统合作程度和群体收益的影响,本质上是将智能体的奖励结构划分为个体奖励、团队奖励以及全局奖励三个部分,探索不同的比例对结果的影响。
环境:
- 重复囚徒困境
- cleanup
具体实现:
- 奖励结构:
- 个体奖励,从环境获得
- 团队奖励:
- 系统奖励:
探索智能体的奖励结构成分对多智能体系统合作程度和群体收益的影响,本质上是将智能体的奖励结构划分为个体奖励、团队奖励以及全局奖励三个部分,探索不同的比例对结果的影响。