摘要: 最近读sutton的“reinforcement learning - An introduction”的读书笔记,其实大多数更像是按照自己理解写的中文翻译,可能语言有时没有那么严谨,主观因素多一点,更像是一种和自己的对话。希望各位看官多多包涵,如果想真正理解一些,最好对照着英文原本看,也许能看出自 阅读全文
posted @ 2017-04-25 16:11 吕吕吕吕吕 阅读(513) 评论(0) 推荐(1) 编辑
摘要: 正文 区分强化学习和其他种类的学习方式最显著的特点是:在强化学习中,训练信息被用于评估动作的好坏,而不是用于指导到底该是什么动作。这也是为何需要主动去做exploration的原因。纯粹的评估性反馈可以表明一个动作的好坏、但并不能知道当前动作是否是最佳选择或者是最差选择。评估性反馈(包括evolua 阅读全文
posted @ 2017-04-25 16:10 吕吕吕吕吕 阅读(1614) 评论(0) 推荐(0) 编辑
摘要: 虽然数学不是那么好,但还是要对这个经典算法真正推导一遍心里才安稳。 主要参考资料:ufldl 开始:首先要明确,反向传播算法,是为了计算loss相对于w,b的偏导数,以此来更新每次学习的w,b,是一个巧妙地计算方法。 首先定义loss函数: 乍一看,这怎么求关于每个权值的偏导数呢?别急,反向传播算法 阅读全文
posted @ 2017-02-25 23:03 吕吕吕吕吕 阅读(1484) 评论(1) 推荐(0) 编辑
摘要: 原文链接:http://101.96.8.164/www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf <Experimental 阅读全文
posted @ 2017-02-21 16:22 吕吕吕吕吕 阅读(621) 评论(0) 推荐(0) 编辑
摘要: (1)首先,出现layer registry error,提示convolutional layer已经注册过了。网上大多的问题是提示unknown layer,并非already registed,大概有两种针对前一种的解决方法:1.链接的caffe静态库和动态库的区别,应该链接动态库?2.caf 阅读全文
posted @ 2017-01-27 09:19 吕吕吕吕吕 阅读(5808) 评论(1) 推荐(0) 编辑
摘要: tmux有一阵子只要进入就挂起卡死,输入任何命令都出现相应的字符,没有其他的反应。 最后的解决办法是:killall -9 tmux 在公司服务器的进程池里面,这样会杀死所有用户之前的tmux进程,幸好别的用户的进程没有权限杀死,不会被影响。 原因:应该就是之前某次使用tmux进入了一个死状态,出不 阅读全文
posted @ 2017-01-26 12:45 吕吕吕吕吕 阅读(2042) 评论(0) 推荐(0) 编辑
摘要: 关于前面安装各种依赖的步骤,以及caffe的git clone都不多说,基本跟网上很多相同,只是后续的步骤有些比较常见的问题,特此总结。 常见问题: (1)在python环境下,import caffe,显示No Module named caffe. 原因:没有把caffe里面的python接口库 阅读全文
posted @ 2017-01-19 16:34 吕吕吕吕吕 阅读(2054) 评论(0) 推荐(0) 编辑
摘要: 这次主要想写两篇,一篇把决策树的相关思想和方法解释清楚,另外一个说一下ensemble形式的决策树,random forest,依据主要是breiman的论文。 这篇讲决策树(主要以cart为例,因为random forest的大多实现也是根据cart) 1、cart的生成。 cart的全称是cla 阅读全文
posted @ 2016-09-09 15:56 吕吕吕吕吕 阅读(7013) 评论(0) 推荐(0) 编辑
摘要: 前一阵面试被问到逻辑回归的问题,没答好,现在对这一部分做个相对彻底的总结。部分内容来源于Andrew Ng的课。 逻辑回归主要解决二分类或者多分类问题,是用回归的思路,套上一个logistic函数,使得输出为0或者1的一种分类策略。 说到逻辑回归,不能不提线性回归,因此先把线性回归捋一遍。 线性回归 阅读全文
posted @ 2016-06-12 21:22 吕吕吕吕吕 阅读(2649) 评论(2) 推荐(0) 编辑
摘要: 8puzzle: using A* algorithm to solve 8-puzzle question. 1.define a state of board position 2.the number of moves made to reach the board position 3.th 阅读全文
posted @ 2016-06-06 22:34 吕吕吕吕吕 阅读(227) 评论(0) 推荐(0) 编辑