摘要: 一、图像通道 1、彩色图像转灰度图 使用函数convert()来进行转换,它是图像实例对象的一个方法,接受一个 mode 参数,用以指定一种色彩模式,mode 的取值可以是如下几种: · 1 (1-bit pixels, black and white, stored with one pixel 阅读全文
posted @ 2018-10-11 15:29 Austin_anheqiao 阅读(526) 评论(0) 推荐(0) 编辑
摘要: 一提到数字图像处理,可能大多数人就会想到matlab,但matlab也有自身的缺点: 1、不开源,价格贵 2、软件容量大。一般3G以上,高版本甚至达5G以上。 3、只能做研究,不易转化成软件。 因此,我们这里使用python这个脚本语言来进行数字图像处理。 要使用python,必须先安装python 阅读全文
posted @ 2018-10-11 15:08 Austin_anheqiao 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 首先将caffe的根目录作为当前目录,然后加载caffe程序自带的小猫图片,并显示。 图片大小为360x480,三通道 首先将caffe的根目录作为当前目录,然后加载caffe程序自带的小猫图片,并显示。 图片大小为360x480,三通道 首先将caffe的根目录作为当前目录,然后加载caffe程序 阅读全文
posted @ 2018-10-11 14:51 Austin_anheqiao 阅读(259) 评论(0) 推荐(0) 编辑
摘要: caffe程序是由c++语言写的,本身是不带数据可视化功能的。只能借助其它的库或接口,如opencv, python或matlab。大部分人使用python接口来进行可视化,因为python出了个比较强大的东西:ipython notebook, 现在的最新版本改名叫jupyter notebook 阅读全文
posted @ 2018-10-11 14:20 Austin_anheqiao 阅读(310) 评论(0) 推荐(0) 编辑
摘要: 学习caffe的目的,不是简单的做几个练习,最终还是要用到自己的实际项目或科研中。因此,本文介绍一下,从自己的原始图片到lmdb数据,再到训练和测试模型的整个流程。 一、准备数据 有条件的同学,可以去imagenet的官网http://www.image-net.org/download-image 阅读全文
posted @ 2018-10-11 14:18 Austin_anheqiao 阅读(187) 评论(0) 推荐(0) 编辑
摘要: 在深度学习的实际应用中,我们经常用到的原始数据是图片文件,如jpg,jpeg,png,tif等格式的,而且有可能图片的大小还不一致。而在caffe中经常使用的数据类型是lmdb或leveldb,因此就产生了这样的一个问题:如何从原始图片文件转换成caffe中能够运行的db(leveldb/lmdb) 阅读全文
posted @ 2018-10-11 14:10 Austin_anheqiao 阅读(258) 评论(0) 推荐(0) 编辑
摘要: caffe的运行提供三种接口:c++接口(命令行)、python接口和matlab接口。本文先对命令行进行解析,后续会依次介绍其它两个接口。 caffe的c++主程序(caffe.cpp)放在根目录下的tools文件夹内, 当然还有一些其它的功能文件,如:convert_imageset.cpp, 阅读全文
posted @ 2018-10-11 13:50 Austin_anheqiao 阅读(154) 评论(0) 推荐(0) 编辑
摘要: 为了程序的简洁,在caffe中是不带练习数据的,因此需要自己去下载。但在caffe根目录下的data文件夹里,作者已经为我们编写好了下载数据的脚本文件,我们只需要联网,运行这些脚本文件就行了。 注意:在caffe中运行所有程序,都必须在根目录下进行,否则会出错 1、mnist实例 mnist是一个手 阅读全文
posted @ 2018-10-11 13:44 Austin_anheqiao 阅读(361) 评论(0) 推荐(0) 编辑
摘要: 上文提到,到目前为止,caffe总共提供了六种优化方法: Stochastic Gradient Descent (type: "SGD"), AdaDelta (type: "AdaDelta"), Adaptive Gradient (type: "AdaGrad"), Adam (type: 阅读全文
posted @ 2018-10-11 11:23 Austin_anheqiao 阅读(263) 评论(0) 推荐(0) 编辑
摘要: solver算是caffe的核心的核心,它协调着整个模型的运作。caffe程序运行必带的一个参数就是solver配置文件。运行代码一般为 在Deep Learning中,往往loss function是非凸的,没有解析解,我们需要通过优化方法来求解。solver的主要作用就是交替调用前向(forwa 阅读全文
posted @ 2018-10-11 11:13 Austin_anheqiao 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 深度网络(net)是一个组合模型,它由许多相互连接的层(layers)组合而成。Caffe就是组建深度网络的这样一种工具,它按照一定的策略,一层一层的搭建出自己的模型。它将所有的信息数据定义为blobs,从而进行便利的操作和通讯。Blob是caffe框架中一种标准的数组,一种统一的内存接口,它详细描 阅读全文
posted @ 2018-10-11 10:46 Austin_anheqiao 阅读(272) 评论(0) 推荐(0) 编辑
摘要: 本文讲解一些其它的常用层,包括:softmax_loss层,Inner Product层,accuracy层,reshape层和dropout层及其它们的参数配置。 1、softmax-loss softmax-loss层和softmax层计算大致是相同的。softmax是一个分类器,计算的是类别的 阅读全文
posted @ 2018-10-11 10:26 Austin_anheqiao 阅读(162) 评论(0) 推荐(0) 编辑
摘要: 在激活层中,对输入数据进行激活操作(实际上就是一种函数变换),是逐元素进行运算的。从bottom得到一个blob数据输入,运算后,从top输入一个blob数据。在运算过程中,没有改变数据的大小,即输入和输出的数据大小是相等的。 输入:n*c*h*w 输出:n*c*h*w 常用的激活函数有sigmoi 阅读全文
posted @ 2018-10-11 10:14 Austin_anheqiao 阅读(271) 评论(0) 推荐(0) 编辑