强化学习
强化学习(Reinforcement learning,简称RL)是机器学习的子领域,涉及决策制定和控制问题。
强化学习需要解决的问题是如何使一个智能体在复杂和不确定性的环境中学会完成目标任务(获得最大奖励)。
强化学习非常通用,用于解决所有涉及做出一系列决策的问题。强化学习甚至可以用于具有序列输出或结构化输出的有监督学习问题。
强化学习已经开始在许多困难的环境下获得成功。强化学习具有很长的研究历史,但是直到最近深度学习取得突破性进展前,它还需要许多特定于问题的工程。
DeepMind’s Atari results, BRETT from Pieter Abbeel’s group, and AlphaGo 均使用强化学习算法。他们没有对环境做太多的假设,因此可以应用于其他设置。
快去成为你想要的样子!