强化学习：很全面的国内外著名强化学习研究小组总结

原文地址：

http://deeprl.neurondance.com/d/154

美国

Stanford：Benjamin Van Roy （摘自 http://deeprl.neurondance.com/d/154）

伯克利：Sergey Levine(论文高产作者)、Pieter Abbel（和Levine并列）

（摘自 http://deeprl.neurondance.com/d/154）

非美国外

UCL：David Sliver(目前好像不指导学生了)、汪军老师等

（摘自 http://deeprl.neurondance.com/d/154）

Alberta：Richard Sutton老爷子、好几个理论的@蓝青峰大佬

（摘自 http://deeprl.neurondance.com/d/154）

莫斯科国立大学：NIPS比赛很强

巴黎Flowers Team：Intrinsic motivation方向

加拿大麦吉尔大学推理与学习实验室

（Doina Precup和Joelle Pineau分别在DeepMind和FAIR Montreal工作）

加拿大U Alberta的增强学习和人工智能（Rich Sutton，Michael Bowling，Patrick Pilarski在DeepMind Edmonton任职；CsabaSzepesvári在DeepMind London任职）

强化学习和在线学习小组，英国伦敦帝国学院（马克·迪森罗思在Prowler.IO）

英国牛津大学白森研究实验室

法国里尔的Inria SequeL（Mohammad Ghavamzadeh，RémiMunos，Bilal Piot在DeepMind，Alessandro Lazaric在FAIR Paris，Olivier Pietquin在Google Brain）

Juergen Schmidhuber的小组，瑞士IDSIA（现为NNAISENSE）

谢恩·曼诺（Shie Mannor）在以色列Technion的小组

Gergely Neu在UPF西班牙巴塞罗那举行

印度IIT-Madras的Balaraman Ravindran小组

加拿大多伦多大学/媒介研究所的Jimmy Ba的小组

加拿大媒介学会的阿米尔·马苏德·法拉赫曼德（Amir-Massoud Farahmand）的Alireza Makhzani

中国

上海交大张伟楠组

南京大学俞扬组

国防科大徐昕

哈工大深圳：
李衍杰老师 http://faculty.hitsz.edu.cn/liyanjie
李老师数学背景，做半马氏决策过程的，学生主要做RL在机器人上的应用（导航决策、调度规划等）
http://deeprl.neurondance.com/d/154/4
香港中文大学（深圳）：
Jim Dai https://scholar.google.com/citations?user=HnO4jIMAAAAJ https://people.orie.cornell.edu/jdai/
Hongyuan Zha https://scholar.google.com/citations?hl=en&user=tqEWl8gAAAAJ
Baoxiang Wang https://bxiangwang.github.io/
http://deeprl.neurondance.com/d/154/3

香港中文大学：周博磊老师

清华大学：张崇洁老师、李升波老师等

北京大学：卢宗青老师等

南京大学：俞扬老师、高阳老师等

上海交通大学：张伟楠老师、俞凯老师（Reinforcement Learning: An Introduction书翻译作者）等

中国科学院：赵冬斌老师、张海峰老师等

天津大学：郝建业老师等

中科大：李厚强老师、周文罡老师、王杰老师、庄连生老师等

国防科技大学：徐昕老师

（摘自 http://deeprl.neurondance.com/d/154）

公司

国外

DeepMind(David Sliver, Marc G. Bellemare)

OpenAI(John Schulman)

FAIR（全方向）：知名的有田渊栋和Noam Brown等，大佬巨多

Google Brain（全方向）：大佬巨多

Salesforce Research

国内

（摘自https://zhuanlan.zhihu.com/p/140528407）

腾讯AI Lab：游戏等；

网易伏羲实验室：游戏；

字节跳动AI Lab：游戏、推荐；

滴滴：运筹优化；

阿里：推荐、运筹优化；

微软亚研院：Research，信息检索和搜索引擎；

华为诺亚方舟实验室：Research；

华为消费者BG智能汽车解决方案BU：RL+自动驾驶

平安保险：强化学习+NLP；

快手AI Lab：游戏、检索；

超参数科技：游戏；

Momenta：RL+自动驾驶

百度PARL团队：自研框架+RL比赛

地平线AI：RL+机器人、自动驾驶

启元世界

南栖仙策

posted on 2024-12-22 19:41 Angry_Panda 阅读(443) 评论(0) 收藏举报

刷新页面返回顶部

Angry Panda（T-800）

强化学习：很全面的国内外著名强化学习研究小组总结

公告

导航