吕吕吕吕吕

2017年4月25日

摘要：最近读sutton的“reinforcement learning - An introduction”的读书笔记，其实大多数更像是按照自己理解写的中文翻译，可能语言有时没有那么严谨，主观因素多一点，更像是一种和自己的对话。希望各位看官多多包涵，如果想真正理解一些，最好对照着英文原本看，也许能看出自阅读全文

posted @ 2017-04-25 16:11 吕吕吕吕吕阅读(513) 评论(0) 推荐(1) 编辑

强化学习经典入门书的读书笔记系列--第二篇（上）

摘要：正文区分强化学习和其他种类的学习方式最显著的特点是：在强化学习中，训练信息被用于评估动作的好坏，而不是用于指导到底该是什么动作。这也是为何需要主动去做exploration的原因。纯粹的评估性反馈可以表明一个动作的好坏、但并不能知道当前动作是否是最佳选择或者是最差选择。评估性反馈（包括evolua 阅读全文

posted @ 2017-04-25 16:10 吕吕吕吕吕阅读(1614) 评论(0) 推荐(0) 编辑

2017年2月25日

反向传播算法数学推导

摘要：虽然数学不是那么好，但还是要对这个经典算法真正推导一遍心里才安稳。主要参考资料:ufldl 开始：首先要明确，反向传播算法，是为了计算loss相对于w,b的偏导数，以此来更新每次学习的ｗ,b，是一个巧妙地计算方法。首先定义loss函数：乍一看，这怎么求关于每个权值的偏导数呢？别急，反向传播算法阅读全文

posted @ 2017-02-25 23:03 吕吕吕吕吕阅读(1484) 评论(1) 推荐(0) 编辑

2017年2月21日

FCN论文阅读记录tips

摘要：原文链接：http://101.96.8.164/www.cv-foundation.org/openaccess/content_cvpr_2015/papers/Long_Fully_Convolutional_Networks_2015_CVPR_paper.pdf <Experimental 阅读全文

posted @ 2017-02-21 16:22 吕吕吕吕吕阅读(621) 评论(0) 推荐(0) 编辑

2017年1月27日

FCN-for-semantic-image-segmentation 训练过程的一些坑记录

摘要：（1）首先，出现layer registry error，提示convolutional layer已经注册过了。网上大多的问题是提示unknown layer，并非already registed，大概有两种针对前一种的解决方法：1.链接的caffe静态库和动态库的区别，应该链接动态库？2.caf 阅读全文

posted @ 2017-01-27 09:19 吕吕吕吕吕阅读(5808) 评论(1) 推荐(0) 编辑

2017年1月26日

tmux的一个小问题

摘要： tmux有一阵子只要进入就挂起卡死，输入任何命令都出现相应的字符，没有其他的反应。最后的解决办法是：killall -9 tmux 在公司服务器的进程池里面，这样会杀死所有用户之前的tmux进程，幸好别的用户的进程没有权限杀死，不会被影响。原因：应该就是之前某次使用tmux进入了一个死状态，出不阅读全文

posted @ 2017-01-26 12:45 吕吕吕吕吕阅读(2042) 评论(0) 推荐(0) 编辑

2017年1月19日

caffe 配置坑的总结

摘要：关于前面安装各种依赖的步骤，以及caffe的git clone都不多说，基本跟网上很多相同，只是后续的步骤有些比较常见的问题，特此总结。常见问题：（1）在python环境下，import caffe，显示No Module named caffe. 原因：没有把caffe里面的python接口库阅读全文

posted @ 2017-01-19 16:34 吕吕吕吕吕阅读(2054) 评论(0) 推荐(0) 编辑

2016年9月9日

决策树（主要针对CART）的生成与剪枝

摘要：这次主要想写两篇，一篇把决策树的相关思想和方法解释清楚，另外一个说一下ensemble形式的决策树，random forest，依据主要是breiman的论文。这篇讲决策树（主要以cart为例，因为random forest的大多实现也是根据cart） 1、cart的生成。 cart的全称是cla 阅读全文

posted @ 2016-09-09 15:56 吕吕吕吕吕阅读(7013) 评论(0) 推荐(0) 编辑

2016年6月12日

逻辑回归&线性回归&梯度下降&正规方程

摘要：前一阵面试被问到逻辑回归的问题，没答好，现在对这一部分做个相对彻底的总结。部分内容来源于Andrew Ng的课。逻辑回归主要解决二分类或者多分类问题，是用回归的思路，套上一个logistic函数，使得输出为0或者1的一种分类策略。说到逻辑回归，不能不提线性回归，因此先把线性回归捋一遍。线性回归阅读全文

posted @ 2016-06-12 21:22 吕吕吕吕吕阅读(2649) 评论(2) 推荐(0) 编辑

2016年6月6日

8puzzle & kd-tree & Boggle

摘要： 8puzzle: using A* algorithm to solve 8-puzzle question. 1.define a state of board position 2.the number of moves made to reach the board position 3.th 阅读全文

posted @ 2016-06-06 22:34 吕吕吕吕吕阅读(227) 评论(0) 推荐(0) 编辑

公告