会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lanthanume
博客园
首页
新随笔
联系
订阅
管理
2022年11月18日
《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS
摘要: 环境: 猎鹿博弈(即代理人要么选择有风险的合作政策,单独代理人选择会导致低收益;要么选择一个安全的合作政策,无论怎么样都会有安全收益)存在多个纳什均衡的环境 h > c >=m > g 创新点: 目标:最终收敛到狩猎均衡获得更高收益,而不是低收益的均衡 采用亲社会代理人机制,代理人考虑伙伴的奖励采取
阅读全文
posted @ 2022-11-18 16:29 lanthanume
阅读(36)
评论(0)
推荐(0)
编辑
公告