【转载】面向多任务的多智能体强化学习理论与应用
地址:
http://www.ia.cas.cn/kygz/zdxm/202203/t20220324_6403039.html
面向多任务的多智能体强化学习理论与应用
【关键词】 新型智能控制;新型智能理论;新型智能模型;新型智能应用;深度强化学习
深度强化学习方法取得了人工智能领域一个个里程碑式的成果,如视频游戏、围棋、国际象棋等完全信息博弈,麻将和星际争霸等更复杂场景下的不完全信息博弈,带动了广泛基础学科的发展和纵深应用领域的技术进步。然而,现实世界的更多问题是面向多任务的多智能体的机器博弈,是人工智能领域的下一项重大挑战。因此,本项目研究内容包括:1) 研究多智能体深度强化学习的收敛性、稳定性和鲁棒性理论,奠定理论基础;2) 研究面向多任务的智能体同构/异构、数量可变和拓扑结构可扩展的学习架构;3) 高维状态动作空间随智能体数量指数增长,研究高效动作空间分解的策略优化方法;4) 不完全信息博弈是显著特点,研究队友间的高效通信方法和环境/对手信息的有效估计表达;5) 研究从仿真场景下小样本的博弈均衡问题,到实体迁移的安全性问题;6) 最后从仿真(游戏博弈)到实体(机器人博弈)验证所提出的面向多任务的多智能体深度强化学习理论和应用。
本博客是博主个人学习时的一些记录,不保证是为原创,个别文章加入了转载的源地址,还有个别文章是汇总网上多份资料所成,在这之中也必有疏漏未加标注处,如有侵权请与博主联系。
如果未特殊标注则为原创,遵循 CC 4.0 BY-SA 版权协议。
posted on 2024-01-23 20:40 Angry_Panda 阅读(85) 评论(0) 编辑 收藏 举报
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2023-01-23 【转载】专利摘要翻译之机器翻译错误类型
2021-01-23 自动判断网络连接状态,如断网则自动进行联网 (特定环境:某高校校园网)
2019-01-23 南京大学俞扬博士:强化学习前沿(下) (转载)
2018-01-23 递归遍历嵌套结构(多层List)中的元素 ------Python