201116西瓜书机器学习系列---16、强化学习
201116西瓜书机器学习系列---16、强化学习
一、总结
一句话总结:
【强化学习的应用非常非常广泛】
【AlphaGo代表着双人完美信息零和游戏。AlphaGo在围棋这么难的问题上取得了举世瞩目的成绩;AlphaGo是人工智能的一个里程碑。】
【Deepmind AlphaStar打败了星际争霸人类高手】。Deepmind在一款多人抢旗游戏中达到了人类玩家水平。OpenAI Five打败了人类刀塔高手。OpenAI训练了类人机器人手Dactyl, 用于灵活地操纵实物。
【谷歌人工智能把强化学习用到数据中心制冷这样一个实用系统。】DeepMimic模拟人形机器人,掌握高难度的运动技能。强化学习也应用于化学分子逆合成和全新药物设计。等等。
二、内容在总结中
博客对应课程的视频位置: