摘要: 一.强化学习的概念1. 基础介绍强化学习模型根据输入学习一系列动作(action),而不同的动作会逐渐累计起来,在某些时候就会得到一些奖赏(reward)。执行某个动作并不能立即获得这个最终奖赏,只能得到一个当前反馈。机器要做的是通过在环境中不断尝试而学得一个策略(p... 阅读全文
posted @ 2018-06-08 11:05 yucen 阅读(934) 评论(0) 推荐(1) 编辑