2018 年 6月 8 日随笔档案 - yucen

摘要：一．强化学习的概念1. 基础介绍强化学习模型根据输入学习一系列动作（action），而不同的动作会逐渐累计起来，在某些时候就会得到一些奖赏（reward）。执行某个动作并不能立即获得这个最终奖赏，只能得到一个当前反馈。机器要做的是通过在环境中不断尝试而学得一个策略（p... 阅读全文

posted @ 2018-06-08 11:05 yucen 阅读(969) 评论(0) 推荐(1) 编辑

yucen