摘要: 0.强化学习(reinforcement learning),特点是引入奖励机制。【强化学习属于机器学习框架中的什么部分?】 1.引出MDP的思路 =>Random variable =>Stchastic Process =>Markov chain/Process =>Markov Reward 阅读全文
posted @ 2020-07-15 12:59 Feynmania 阅读(658) 评论(0) 推荐(0) 编辑