随笔档案「2018年6月30日」：【强化学习篇】--强化学习案例详解一 ... - L先生AI课堂

2018年6月30日

摘要：一、前述本文通过一个案例来讲解Q-Learning 二、具体 1、案例假设我们需要走到5房间。转变为如下图：先构造奖励，达到5，即能够走得5的action则说明奖励比较高设置成100，没有达到5说明奖励比较低，设置成0。 Q-learning实现步骤： 2、案例详解：第一步的Q(1,5)：最阅读全文

posted @ 2018-06-30 23:09 L先生AI课堂阅读(5040) 评论(1) 推荐(0)

【强化学习篇】--强化学习从初识到应用

摘要：一、前述强化学习是学习一个最优策略(policy)，可以让本体(agent)在特定环境(environment)中，根据当前的状态(state)，做出行动(action)，从而获得最大回报(G or return)。通俗点说：学习系统没有像很多其它形式的机器学习方法一样被告知应该做出什么行为，必阅读全文

posted @ 2018-06-30 16:46 L先生AI课堂阅读(912) 评论(0) 推荐(0)

【Caffe篇】--Caffe solver层从初始到应用

摘要：一、前述 solve主要是定义求解过程，超参数的二、具体阅读全文

posted @ 2018-06-30 14:26 L先生AI课堂阅读(408) 评论(0) 推荐(0)

【Caffe篇】--Caffe从入门到初始及各层介绍

摘要：一、前述 Caffe，全称Convolutional Architecture for Fast Feature Embedding。是一种常用的深度学习框架，主要应用在视频、图像处理方面的应用上。caffe是一个清晰，可读性高，快速的深度学习框架。作者是贾扬清，加州大学伯克利的ph.D，现就职于F 阅读全文

posted @ 2018-06-30 12:20 L先生AI课堂阅读(2963) 评论(0) 推荐(0)

L先生AI课堂

联想集团算法工程师一枚！ Get busy living, or get busy dying!!

公告