多代理强化学习综述：原理、算法与挑战

引言

多代理强化学习（Multi-Agent Reinforcement Learning, MARL）是强化学习的一个重要分支，它将传统的单代理强化学习概念扩展到多代理环境中。在MARL中，多个代理通过与环境和其他代理的交互来学习最优策略，以在协作或竞争场景中最大化累积奖励。

MAgent中代理之间的对抗（混合MARL示例）

MARL的正式定义如下：多代理强化学习是强化学习的一个子领域，专注于研究在共享环境中共存的多个学习代理的行为。每个代理都受其个体奖励驱动，采取行动以推进自身利益；在某些环境中，这些利益可能与其他代理的利益相冲突，从而产生复杂的群体动态。

posted @ 2024-10-12 09:46 deephub 阅读(75) 评论(0) 收藏举报

刷新页面返回顶部