王老头

导航

Windows下Caffe实现图像分类

前言:最近参加百度点石大赛,完成商家招牌的分类和检测,把实验过程简单记录下来,具体步骤如下。

环境配置:windows下的visual studio2013和caffe(cpu版本)环境搭建请看我另一篇博客:http://www.cnblogs.com/wmr95/articles/9021748.html

下面写写具体实验流程:

1.首先把比赛平台下的数据集下载放到caffe-master路径下data文件夹中,如图:

首先数据提供的是train和test图片数据及label的txt文件,具体如图所示:

其中train文件夹下的图片和train.txt中的内容如图:

2.接下来根据图片和label信息得到lmdb格式文件train_lmdb新建一个create_lmdb.bat 文件,内容为:

E:\caffe-master\Build\x64\Release\convert_imageset.exe --resize_height=128 --resize_width=128 --shuffle --backend="lmdb" E:\caffe-master\data\signboard\train\ E:\caffe-master\data\signboard\train.txt train_lmdb  

pause

简单解释一下,第一个显然是你编译好的caffe中的exe工具,第二和第三指定对图像进行resize(因为原图大小尺寸不一),第四个是shuffle参数,随机打乱一下label的txt列表,第六个--backend指定生成lmdb格式(还可以指定为leveldb,另外一种格式),第七个指定train文件夹下的图片,第八个指定train的label信息,最后一个指定得到的train_lmdb(这个不能添加路径,由程序自己创建文件夹,如果提前有这个文件夹会报错)。

执行成功截图:

在当前路径下得到train_lmdb文件,如图所示:

3.根据得到的lmdb格式文件train_lmdb得到均值文件

新建一个compute_image_mean.bat文件,代码内容为:

E:\caffe-master\Build\x64\Release\compute_image_mean.exe E:\caffe-master\data\signboard\train_lmdb mean.binaryproto
     
pause  

具体意思大概看下就了解,不具体解释了。运行成功截图为:

 在当前路径下得到的mean.binaryproto文件为:

4.接下来就准备网络模型的事情了(简单举个例子,我这里先采用的是cifar10的网络,接下来以这个为例)

先将examples下的cifar10拷贝一份命名为signboard,这里主要用到两个prototxt文件:

train_test.prototxt的内容需要做修改:(mean_file和source需要指定路径,另外我们是进行100分类,最后的output由10改为100)

这里需要注意,因为我们没有得到test_lmdb文件,这里需要把phase的TEST部分删除,只留下TRAIN部分。

然后再修改solver.prototxt文件:

因为训练过程中不包含测试集,所以这里需要把test部分注释,否则会出现“Unknown bottom blob 'data' (layer 'conv1',bottom index 0)”的错误。

错误截图为:

5.完成数据处理和网络模型后,就可以进行训练模型了,在caffe-master根目录下新建一个trian_signboard.bat文件,代码内容为:

.\Build\x64\Release\caffe.exe train --solver=.\examples\signboard\cifar10_quick_solver.prototxt  
pause

在caffe-master根目录下执行这个.bat文件就可以训练了,开心的飞起~~训练过程截图为:

这只是初步的把分类实验跑起来,后期打算做数据增强和finetune操作。期待竞赛有个好成绩~~

 

posted on 2018-05-10 23:38  王老头  阅读(2795)  评论(0编辑  收藏  举报