强化学习:很全面的国内外著名强化学习研究小组总结


原文地址:

http://deeprl.neurondance.com/d/154





美国

Stanford:Benjamin Van Roy (摘自 http://deeprl.neurondance.com/d/154)

伯克利:Sergey Levine(论文高产作者)、Pieter Abbel(和Levine并列)

(摘自 http://deeprl.neurondance.com/d/154)

非美国外

UCL:David Sliver(目前好像不指导学生了)、汪军老师等

(摘自 http://deeprl.neurondance.com/d/154)

Alberta:Richard Sutton老爷子、好几个理论的@蓝青峰大佬

(摘自 http://deeprl.neurondance.com/d/154)

莫斯科国立大学:NIPS比赛很强

巴黎Flowers Team:Intrinsic motivation方向

加拿大麦吉尔大学推理与学习实验室

(Doina Precup和Joelle Pineau分别在DeepMind和FAIR Montreal工作)

加拿大U Alberta的增强学习和人工智能(Rich Sutton,Michael Bowling,Patrick Pilarski在DeepMind Edmonton任职;CsabaSzepesvári在DeepMind London任职)

强化学习和在线学习小组,英国伦敦帝国学院(马克·迪森罗思在Prowler.IO)

英国牛津大学白森研究实验室

法国里尔的Inria SequeL(Mohammad Ghavamzadeh,RémiMunos,Bilal Piot在DeepMind,Alessandro Lazaric在FAIR Paris,Olivier Pietquin在Google Brain)

Juergen Schmidhuber的小组,瑞士IDSIA(现为NNAISENSE)

谢恩·曼诺(Shie Mannor)在以色列Technion的小组

Gergely Neu在UPF西班牙巴塞罗那举行

印度IIT-Madras的Balaraman Ravindran小组

加拿大多伦多大学/媒介研究所的Jimmy Ba的小组

加拿大媒介学会的阿米尔·马苏德·法拉赫曼德(Amir-Massoud Farahmand)的Alireza Makhzani

中国

上海交大张伟楠组

南京大学俞扬组

国防科大徐昕

哈工大深圳:
李衍杰老师 http://faculty.hitsz.edu.cn/liyanjie
李老师数学背景,做半马氏决策过程的,学生主要做RL在机器人上的应用(导航决策、调度规划等)
http://deeprl.neurondance.com/d/154/4
香港中文大学(深圳):
Jim Dai https://scholar.google.com/citations?user=HnO4jIMAAAAJ https://people.orie.cornell.edu/jdai/
Hongyuan Zha https://scholar.google.com/citations?hl=en&user=tqEWl8gAAAAJ
Baoxiang Wang https://bxiangwang.github.io/
http://deeprl.neurondance.com/d/154/3

香港中文大学:周博磊老师

清华大学:张崇洁老师、李升波老师等

北京大学:卢宗青老师等

南京大学:俞扬老师、高阳老师等

上海交通大学:张伟楠老师、俞凯老师(Reinforcement Learning: An Introduction书翻译作者)等

中国科学院:赵冬斌老师、张海峰老师等

天津大学:郝建业老师等

中科大:李厚强老师、周文罡老师、王杰老师、庄连生老师等

国防科技大学:徐昕老师

(摘自 http://deeprl.neurondance.com/d/154)​

公司

国外

DeepMind(David Sliver, Marc G. Bellemare)

OpenAI(John Schulman)

FAIR(全方向):知名的有田渊栋和Noam Brown等,大佬巨多

Google Brain(全方向):大佬巨多

Salesforce Research

国内

(摘自https://zhuanlan.zhihu.com/p/140528407)

腾讯AI Lab:游戏等;

网易伏羲实验室:游戏;

字节跳动AI Lab:游戏、推荐;

滴滴:运筹优化;

阿里:推荐、运筹优化;

微软亚研院:Research,信息检索和搜索引擎;

华为诺亚方舟实验室:Research;

华为消费者BG智能汽车解决方案BU:RL+自动驾驶

平安保险:强化学习+NLP;

快手AI Lab:游戏、检索;

超参数科技:游戏;

Momenta:RL+自动驾驶

百度PARL团队:自研框架+RL比赛

地平线AI:RL+机器人、自动驾驶

启元世界

南栖仙策


posted on 2024-12-22 19:41  Angry_Panda  阅读(214)  评论(0)    收藏  举报

导航