会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
lanthanume
博客园
首页
新随笔
联系
订阅
管理
2022年11月12日
《Adaptive Mechanism Design: Learning to Promote Cooperation》 2017-arxiv
摘要: 背景及问题: 外部代理如何在观察学习智能体的基础上分配额外的奖惩促进学习者之间的合作。 创新及问题解决: 提出一条规则:通过考虑智能体预期的参数更新来自动学习创建正确的激励措施(等同于创建一种自适应社会奖惩机制) 证明了在某些环境下,措施在一定时间后关闭合作结果也是稳定的,而有些游戏则需要持续性的干
阅读全文
posted @ 2022-11-12 01:02 lanthanume
阅读(19)
评论(0)
推荐(0)
编辑
公告