会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lanthanume
博客园
首页
新随笔
联系
订阅
管理
2022年11月18日
《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS
摘要: 环境: 猎鹿博弈(即代理人要么选择有风险的合作政策,单独代理人选择会导致低收益;要么选择一个安全的合作政策,无论怎么样都会有安全收益)存在多个纳什均衡的环境 h > c >=m > g 创新点: 目标:最终收敛到狩猎均衡获得更高收益,而不是低收益的均衡 采用亲社会代理人机制,代理人考虑伙伴的奖励采取
阅读全文
posted @ 2022-11-18 16:29 lanthanume
阅读(33)
评论(0)
推荐(0)
编辑
公告