微信扫一扫打赏支持

201116西瓜书机器学习系列---16、强化学习

201116西瓜书机器学习系列---16、强化学习

一、总结

一句话总结:

【强化学习的应用非常非常广泛】
【AlphaGo代表着双人完美信息零和游戏。AlphaGo在围棋这么难的问题上取得了举世瞩目的成绩;AlphaGo是人工智能的一个里程碑。】
【Deepmind AlphaStar打败了星际争霸人类高手】。Deepmind在一款多人抢旗游戏中达到了人类玩家水平。OpenAI Five打败了人类刀塔高手。OpenAI训练了类人机器人手Dactyl, 用于灵活地操纵实物。
【谷歌人工智能把强化学习用到数据中心制冷这样一个实用系统。】DeepMimic模拟人形机器人,掌握高难度的运动技能。强化学习也应用于化学分子逆合成和全新药物设计。等等。

 

 

二、内容在总结中

博客对应课程的视频位置:

 

 

 
posted @ 2020-11-20 02:50  范仁义  阅读(118)  评论(0编辑  收藏  举报