摘要: 强化学习理解 强化学习是智能体与环境的交互(探索和试错),通过交互信息来感知环境,从而调整自己的行为,选择出最好的结果。 强化学习更加侧重于从互动中进行目标导向的学习。 【将情境映射到行动,以便最大化数值奖赏信号。通俗理解为对人学习过程的简单模拟,相当于人做了多次的探索,把最后的劳动成果以状态值函数 阅读全文
posted @ 2021-05-18 11:19 芋圆院长 阅读(174) 评论(0) 推荐(0) 编辑