强化学习:很全面的国内外著名强化学习研究小组总结


原文地址:

http://deeprl.neurondance.com/d/154





美国

Stanford:Benjamin Van Roy (摘自 http://deeprl.neurondance.com/d/154)

伯克利:Sergey Levine(论文高产作者)、Pieter Abbel(和Levine并列)

(摘自 http://deeprl.neurondance.com/d/154)

非美国外

UCL:David Sliver(目前好像不指导学生了)、汪军老师等

(摘自 http://deeprl.neurondance.com/d/154)

Alberta:Richard Sutton老爷子、好几个理论的@蓝青峰大佬

(摘自 http://deeprl.neurondance.com/d/154)

莫斯科国立大学:NIPS比赛很强

巴黎Flowers Team:Intrinsic motivation方向

加拿大麦吉尔大学推理与学习实验室

(Doina Precup和Joelle Pineau分别在DeepMind和FAIR Montreal工作)

加拿大U Alberta的增强学习和人工智能(Rich Sutton,Michael Bowling,Patrick Pilarski在DeepMind Edmonton任职;CsabaSzepesvári在DeepMind London任职)

强化学习和在线学习小组,英国伦敦帝国学院(马克·迪森罗思在Prowler.IO)

英国牛津大学白森研究实验室

法国里尔的Inria SequeL(Mohammad Ghavamzadeh,RémiMunos,Bilal Piot在DeepMind,Alessandro Lazaric在FAIR Paris,Olivier Pietquin在Google Brain)

Juergen Schmidhuber的小组,瑞士IDSIA(现为NNAISENSE)

谢恩·曼诺(Shie Mannor)在以色列Technion的小组

Gergely Neu在UPF西班牙巴塞罗那举行

印度IIT-Madras的Balaraman Ravindran小组

加拿大多伦多大学/媒介研究所的Jimmy Ba的小组

加拿大媒介学会的阿米尔·马苏德·法拉赫曼德(Amir-Massoud Farahmand)的Alireza Makhzani

中国

上海交大张伟楠组

南京大学俞扬组

国防科大徐昕

哈工大深圳:
李衍杰老师 http://faculty.hitsz.edu.cn/liyanjie
李老师数学背景,做半马氏决策过程的,学生主要做RL在机器人上的应用(导航决策、调度规划等)
http://deeprl.neurondance.com/d/154/4
香港中文大学(深圳):
Jim Dai https://scholar.google.com/citations?user=HnO4jIMAAAAJ https://people.orie.cornell.edu/jdai/
Hongyuan Zha https://scholar.google.com/citations?hl=en&user=tqEWl8gAAAAJ
Baoxiang Wang https://bxiangwang.github.io/
http://deeprl.neurondance.com/d/154/3

香港中文大学:周博磊老师

清华大学:张崇洁老师、李升波老师等

北京大学:卢宗青老师等

南京大学:俞扬老师、高阳老师等

上海交通大学:张伟楠老师、俞凯老师(Reinforcement Learning: An Introduction书翻译作者)等

中国科学院:赵冬斌老师、张海峰老师等

天津大学:郝建业老师等

中科大:李厚强老师、周文罡老师、王杰老师、庄连生老师等

国防科技大学:徐昕老师

(摘自 http://deeprl.neurondance.com/d/154)​

公司

国外

DeepMind(David Sliver, Marc G. Bellemare)

OpenAI(John Schulman)

FAIR(全方向):知名的有田渊栋和Noam Brown等,大佬巨多

Google Brain(全方向):大佬巨多

Salesforce Research

国内

(摘自https://zhuanlan.zhihu.com/p/140528407)

腾讯AI Lab:游戏等;

网易伏羲实验室:游戏;

字节跳动AI Lab:游戏、推荐;

滴滴:运筹优化;

阿里:推荐、运筹优化;

微软亚研院:Research,信息检索和搜索引擎;

华为诺亚方舟实验室:Research;

华为消费者BG智能汽车解决方案BU:RL+自动驾驶

平安保险:强化学习+NLP;

快手AI Lab:游戏、检索;

超参数科技:游戏;

Momenta:RL+自动驾驶

百度PARL团队:自研框架+RL比赛

地平线AI:RL+机器人、自动驾驶

启元世界

南栖仙策


posted on   Angry_Panda  阅读(108)  评论(0编辑  收藏  举报

相关博文:
阅读排行:
· 周边上新:园子的第一款马克杯温暖上架
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器
· DeepSeek如何颠覆传统软件测试?测试工程师会被淘汰吗?
· 使用C#创建一个MCP客户端
历史上的今天:
2023-12-22 母校老照片——辽宁大学
2023-12-22 如何看待拼多多大战京东和淘宝
2023-12-22 分享一个外网的关于量子计算的学术观点:通用量子计算在未来可以预见的时间内不能够被实现
2023-12-22 南京大学周志华团队在国内人工智能领域获得如此高排名的原因是什么?
2023-12-22 AI实践者师生夏令营讲座视频:南京大学Lamda实验室(周志华 团队)讲座视频 —— 强化学习的局限性与展望
2023-12-22 自然语言处理:通过API调用各大公司的机器翻译开放平台

导航

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示