随笔档案「2022年11月18日」：《Prosocial learning agents solve genera... - lanthanume

2022年11月18日

《Prosocial learning agents solve generalized Stag Hunts better than selfish ones》 2018-AAMAS

摘要：环境：猎鹿博弈(即代理人要么选择有风险的合作政策，单独代理人选择会导致低收益；要么选择一个安全的合作政策，无论怎么样都会有安全收益)存在多个纳什均衡的环境 h > c >=m > g 创新点：目标：最终收敛到狩猎均衡获得更高收益，而不是低收益的均衡采用亲社会代理人机制，代理人考虑伙伴的奖励采取阅读全文

posted @ 2022-11-18 16:29 lanthanume 阅读(54) 评论(0) 推荐(0)

lanthanume

公告