摘要: 强化学习 也称增强学习。 强化学习就是程序或智能体(agent)通过与环境不断地进行交互学习一个从环境到动作的映射,学习的目标就是使累计回报最大化。 强化学习是一种试错学习,因其在各种状态(环境)下需要尽量尝试所有可以选择的动作,通过环境给出的反馈(即奖励)来判断动作的优劣,最终获得环境和最优动作的 阅读全文
posted @ 2021-11-01 21:31 奶酥 阅读(336) 评论(0) 推荐(0) 编辑