2019 年 5月 22 日随笔档案 - 瘋耔

2019年5月22日

摘要：本文简要介绍了强化学习及其重要概念和术语，并着重介绍了 Q-Learning 算法、SARSA、DQN 和 DDPG 算法。强化学习（RL）指的是一种机器学习方法，其中智能体在下一个时间步中收到延迟的奖励（对前一步动作的评估）。这种方法主要用于雅达利（Atari）、马里奥（Mario）等游戏中，表阅读全文

posted @ 2019-05-22 17:06 瘋耔阅读(511) 评论(0) 推荐(0) 编辑