【转载】面向多任务的多智能体强化学习理论与应用

地址:

http://www.ia.cas.cn/kygz/zdxm/202203/t20220324_6403039.html




面向多任务的多智能体强化学习理论与应用


【关键词】 新型智能控制;新型智能理论;新型智能模型;新型智能应用;深度强化学习

深度强化学习方法取得了人工智能领域一个个里程碑式的成果,如视频游戏、围棋、国际象棋等完全信息博弈,麻将和星际争霸等更复杂场景下的不完全信息博弈,带动了广泛基础学科的发展和纵深应用领域的技术进步。然而,现实世界的更多问题是面向多任务的多智能体的机器博弈,是人工智能领域的下一项重大挑战。因此,本项目研究内容包括:1) 研究多智能体深度强化学习的收敛性、稳定性和鲁棒性理论,奠定理论基础;2) 研究面向多任务的智能体同构/异构、数量可变和拓扑结构可扩展的学习架构;3) 高维状态动作空间随智能体数量指数增长,研究高效动作空间分解的策略优化方法;4) 不完全信息博弈是显著特点,研究队友间的高效通信方法和环境/对手信息的有效估计表达;5) 研究从仿真场景下小样本的博弈均衡问题,到实体迁移的安全性问题;6) 最后从仿真(游戏博弈)到实体(机器人博弈)验证所提出的面向多任务的多智能体深度强化学习理论和应用。


image

posted on   Angry_Panda  阅读(85)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2023-01-23 【转载】专利摘要翻译之机器翻译错误类型
2021-01-23 自动判断网络连接状态,如断网则自动进行联网 (特定环境:某高校校园网)
2019-01-23 南京大学俞扬博士:强化学习前沿(下) (转载)
2018-01-23 递归遍历嵌套结构(多层List)中的元素 ------Python

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示