摘要: 一篇很短的小短文,主要推荐下做科学计算是大量数据的储存问题最近在做一个CNN的项目,文件夹里有20w张图片要读入并保存到一个data文件(不然每次都读20w文件太麻烦)。折腾了一个下午,发现了一个极好用的包 h5py:将数据储存在hdf5文件中。这东西有多好用呢?速度,内存占用,压缩程度都比cPic... 阅读全文
posted @ 2014-04-17 19:01 Pony_s 阅读(21548) 评论(2) 推荐(2) 编辑
摘要: 出于需要在电脑上安装hadoop,版本:hadoop 1.2.1 (stable)按照网上教程安装成功,把一点需要修改的地方说说。参考博客:ubuntu12.04 hadoop单机模式和伪分布模式搭建(基本全程按照这个就行)两个需要注意的地方:1、以后要下载什么东西,请在百度上搜索”名字+百度网盘“。别傻傻的去主页下,慢。2、hadoop从0.20.2版本升级到1.2.1版本之后,在很多时候都会报如下警告:Warning: $HADOOP_HOME is deprecated. 解决方法:在conf/hadoop-env.sh中加入export HADOOP_HOME_WARN_SUPPRE. 阅读全文
posted @ 2014-03-11 23:40 Pony_s 阅读(286) 评论(0) 推荐(0) 编辑
摘要: 因为用到theano写函数的时候饱受数据结构困扰于是上网找了一篇numpy教程(theano的数据类型是基于numpy的)原文排版更好,阅读体验更佳:http://phddreamer.blog.163.com/blog/static/18993409620135271852137/先决条件在阅读这个教程之前,你多少需要知道点python。如果你想重新回忆下,请看看Python Tutorial.如果你想要运行教程中的示例,你至少需要在你的电脑上安装了以下一些软件:PythonNumPy这些是可能对你有帮助的:ipython是一个净强化的交互Python Shell,对探索NumPy的特性非常 阅读全文
posted @ 2013-12-14 09:07 Pony_s 阅读(676) 评论(0) 推荐(0) 编辑
摘要: 需要搭建一个比较复杂的CNN网络,希望通过预训练来提高CNN的表现。上网找了一下,关于CAE(Convolutional Auto-Encoders)的文章还真是少,勉强只能找到一篇瑞士的文章、 Stacked Convolutional Auto-Encoders forHierarchical Feature Extraction干货少,不过好歹有对模型的描述,拿来看看。概述: 本文提出了一种卷积神经网络的自编码表达,用于对卷积神经网络进行预训练。具体内容: 原文废话挺多,我只关心模型——CAE: 卷积层的获得: 再表达: 其中“ * ”表示卷积;再... 阅读全文
posted @ 2013-12-04 22:08 Pony_s 阅读(6417) 评论(1) 推荐(0) 编辑
摘要: 简介:这是一片发表在TPAMI上的文章,可以看见作者有余凯(是百度的那个余凯吗?)本文提出了一种3D神经网络:通过在神经网络的输入中增加时间这个维度(连续帧),赋予神经网络行为识别的功能。相应提出了一种3D卷积,对三幅连续帧用一个3D卷积核进行卷积(可以理解为用三个二维卷积核卷积三张图)。3D神经网络结构图:input—>H1 神经网络的输入为7张大小为60*40的连续帧,7张帧通过事先设定硬核(hardwired kernels)获得5种不同特征:灰度、x方向梯度、y方向梯度、x方向光流、y方向光流,5个channels一共33个maps。对于这个做法,原文这么解释“相比于随机初始化, 阅读全文
posted @ 2013-11-29 19:14 Pony_s 阅读(25406) 评论(9) 推荐(2) 编辑
摘要: 原文地址:http://burner1024.blog.163.com/blog/static/17447800420126191858424/Windows下的下载工具--迅雷,之所以下载速度快,乃是它能搜索资源、为己所用,而不是仅仅从原始地址这单一资源处下载。Ubuntu下也有类似的工具,那就是aira2。aira2是一个命令行下载工具,可以配合其他图形界面的下载软件使用。我用的是uget+aria2。uget本身是一个小巧实用的多线程下载工具,加上aria2作为插件,下载速度有明显提高。一、安装。uget和aria2都可以在“软件中心”中安装,但是版本太老啦,无法发挥作用,所以最好还是在 阅读全文
posted @ 2013-11-28 23:54 Pony_s 阅读(452) 评论(0) 推荐(0) 编辑
摘要: 写在前面的废话:出了托福成绩啦,本人战战兢兢考了个97!成绩好的出乎意料!喜大普奔!撒花庆祝!傻…………寒假还要怒学一个月刷100庆祝个毛线…………正题:题目是CNN,但是CNN的具体原理和之后会写一篇博客在deeplearning目录下详细说明。简单地说,CNN与NN相比独特之处在于用部分连接代替全链接,并用pooling来对数据进行降维,这样做有几个好处:对于大图像来说所需训练的参数大大减少获取图像的部分特征而非全局特征pooling使得网络的输出结果具有一定的平移和遮挡不变性demo见:(效果还是挺好的,当年华尔街银行用来读支票)这里主要说代码。1、类:LeNetConvPoolLaye 阅读全文
posted @ 2013-11-28 23:49 Pony_s 阅读(6606) 评论(3) 推荐(0) 编辑
摘要: 最近用上ubuntu跑theano,碰到的一个问题就是用sublime编辑代码的时候无法输入中文。读代码经常要写注释不能用中文是在是麻烦。曾经考虑过使用别的文本编辑器,但是sublime的用户界面是在是舒服又好用。上网找了个方法放在这里,实测可用。转自知乎:http://www.zhihu.com/question/20163104先安装能在sublime text 2显示中文的字体,有一个非常好的开源字体,叫做“文泉驿字体”,安装如下:sudo apt-get install xfonts-wqy官方网站:http://wenq.org/index.cgi?%E9%A6%96%E9%A1%B 阅读全文
posted @ 2013-11-28 22:02 Pony_s 阅读(410) 评论(0) 推荐(0) 编辑
摘要: 由于学习需要用到GPU加速机器学习算法,需要安装theano+cuda。开源库的一大问题就是:难安装。为了搞好这个配置,我是前前后后花了3天,重装了3次ubuntu重装了5次驱动才搞定。故发此贴,给出最简单安装方法(如果我还记得的话)。因为ubuntu下各种软件依赖关系太多,最好全新ubuntu安装theano和cuda,然后在更新最好是这么做,再多一步都可能搞错………………一、安装ubuntuwindow下安装theano和其他的依赖库相当复杂,甚至需要用到edu的邮箱。果断抛弃,用ubuntu搭起环境。1、制作U盘下好ubuntu(12.04)的iso后,拿出一个4GU盘,插进去格式化。再 阅读全文
posted @ 2013-11-23 00:15 Pony_s 阅读(4047) 评论(0) 推荐(2) 编辑
摘要: 废话:这博客有三个月没更新了。三个月!!!尼玛我真是够懒了!!这三个月我复习什么去了呢?托福…………也不是说我复习紧张到完全没时间更新,事实上我甚至有时间打LOL。只是说,我一次就只能(只想?)做一件事情。对我来说,在两种不同思维之间转换是十分耗费能量的。说白了我!就!是!个!废!柴!……哼……前言:PCA与白化,就是对输入数据进行预处理,前者对数据进行降维,后者对数据进行方差处理。虽说原理挺简单,但是作用可不小。之前的师兄做实验的时候,就是忘了对数据预处理,结果实验失败了。可见好的PCA对实验结果影响挺重要。主成成分分析(PCA):主要思想(我总结的):通过抛弃携带信息量较少的维度对数据进行 阅读全文
posted @ 2013-11-17 23:31 Pony_s 阅读(15117) 评论(1) 推荐(0) 编辑