微信扫一扫打赏支持

201116西瓜书机器学习系列---16、强化学习

201116西瓜书机器学习系列---16、强化学习

一、总结

一句话总结：

【强化学习的应用非常非常广泛】

【AlphaGo代表着双人完美信息零和游戏。AlphaGo在围棋这么难的问题上取得了举世瞩目的成绩；AlphaGo是人工智能的一个里程碑。】

【Deepmind AlphaStar打败了星际争霸人类高手】。Deepmind在一款多人抢旗游戏中达到了人类玩家水平。OpenAI Five打败了人类刀塔高手。OpenAI训练了类人机器人手Dactyl, 用于灵活地操纵实物。

【谷歌人工智能把强化学习用到数据中心制冷这样一个实用系统。】DeepMimic模拟人形机器人，掌握高难度的运动技能。强化学习也应用于化学分子逆合成和全新药物设计。等等。

二、内容在总结中

博客对应课程的视频位置：

posted @ 2020-11-20 02:50 范仁义阅读(171) 评论(0) 收藏举报

刷新页面返回顶部