摘要: 混合动机强化学习中的社会多样性与社会偏好 总结: 本质是在研究当智能体群体中的个体具有独特性质时在困境强化学习中对结果的影响。提出了一个社会价值偏向取向的概念来使得群体中的智能体异质之后进行对比实验,实质上还是对奖励函数的更改,但是奖励函数具有多种形式,不是具体的。 环境: Harvest Patc 阅读全文
posted @ 2022-12-23 20:32 lanthanume 阅读(28) 评论(0) 推荐(0) 编辑