2019年11月22日
摘要: 一、强化学习简介 强化学习强调如何基于环境而行动,以取得最大化的预期收益。灵感来源于心理学中的行为主义理论,即有机体在环境给予奖励或惩罚的刺激下,逐步形成对刺激的预期,产生能获得最大利益的习惯性行为。 强化学习所解决问题的特点:1、智能体和环境之间不断交互;2、搜索和试错;3、延迟奖励(当前的动作很 阅读全文
posted @ 2019-11-22 09:29 筱筱蛋坑 阅读(718) 评论(0) 推荐(0) 编辑