摘要: 本文简要介绍了强化学习及其重要概念和术语,并着重介绍了 Q-Learning 算法、SARSA、DQN 和 DDPG 算法。 强化学习(RL)指的是一种机器学习方法,其中智能体在下一个时间步中收到延迟的奖励(对前一步动作的评估)。这种方法主要用于雅达利(Atari)、马里奥(Mario)等游戏中,表 阅读全文
posted @ 2019-05-22 17:06 瘋耔 阅读(511) 评论(0) 推荐(0) 编辑
跳至侧栏