Fork me on GitHub
摘要: 一、前述 本文通过一个案例来讲解Q-Learning 二、具体 1、案例 假设我们需要走到5房间。 转变为如下图:先构造奖励,达到5,即能够走得5的action则说明奖励比较高设置成100,没有达到5说明奖励比较低,设置成0。 Q-learning实现步骤: 2、案例详解: 第一步的Q(1,5):最 阅读全文
posted @ 2018-06-30 23:09 L先生AI课堂 阅读(4887) 评论(1) 推荐(0) 编辑
摘要: 一、前述 强化学习是学习一个最优策略(policy),可以让本体(agent)在特定环境(environment)中,根据当前的状态(state),做出行动(action),从而获得最大回报(G or return)。 通俗点说:学习系统没有像很多其它形式的机器学习方法一样被告知应该做出什么行为,必 阅读全文
posted @ 2018-06-30 16:46 L先生AI课堂 阅读(862) 评论(0) 推荐(0) 编辑
摘要: 一、前述 solve主要是定义求解过程,超参数的 二、具体 阅读全文
posted @ 2018-06-30 14:26 L先生AI课堂 阅读(389) 评论(0) 推荐(0) 编辑
摘要: 一、前述 Caffe,全称Convolutional Architecture for Fast Feature Embedding。是一种常用的深度学习框架,主要应用在视频、图像处理方面的应用上。caffe是一个清晰,可读性高,快速的深度学习框架。作者是贾扬清,加州大学伯克利的ph.D,现就职于F 阅读全文
posted @ 2018-06-30 12:20 L先生AI课堂 阅读(2895) 评论(0) 推荐(0) 编辑