会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lanthanume
博客园
首页
新随笔
联系
订阅
管理
2022年12月24日
《LEARNING HOMOPHILIC INCENTIVES IN SEQUENTIAL SOCIAL DILEMMAS》 2022-ICLR
摘要: 在序贯社会困境中学习同质性激励 总结: 由于在类似harvest这种困境中,带有惩罚功能的智能体惩罚他人会付出代价,由此可能引发第二层级的搭便车行为,即都不想进行惩罚动作付出小代价,那么最终困境将无法得到解决,最终导致合作行为地不稳定。为了解决上述问题,论文提出了利用同质性激励的方案,即具有相似行为
阅读全文
posted @ 2022-12-24 02:05 lanthanume
阅读(22)
评论(0)
推荐(0)
编辑
公告