Windows下Caffe实现图像分类
前言:最近参加百度点石大赛,完成商家招牌的分类和检测,把实验过程简单记录下来,具体步骤如下。
环境配置:windows下的visual studio2013和caffe(cpu版本)环境搭建请看我另一篇博客:http://www.cnblogs.com/wmr95/articles/9021748.html
下面写写具体实验流程:
1.首先把比赛平台下的数据集下载放到caffe-master路径下data文件夹中,如图:
首先数据提供的是train和test图片数据及label的txt文件,具体如图所示:
其中train文件夹下的图片和train.txt中的内容如图:
2.接下来根据图片和label信息得到lmdb格式文件train_lmdb新建一个create_lmdb.bat 文件,内容为:
E:\caffe-master\Build\x64\Release\convert_imageset.exe --resize_height=128 --resize_width=128 --shuffle --backend="lmdb" E:\caffe-master\data\signboard\train\ E:\caffe-master\data\signboard\train.txt train_lmdb pause
简单解释一下,第一个显然是你编译好的caffe中的exe工具,第二和第三指定对图像进行resize(因为原图大小尺寸不一),第四个是shuffle参数,随机打乱一下label的txt列表,第六个--backend指定生成lmdb格式(还可以指定为leveldb,另外一种格式),第七个指定train文件夹下的图片,第八个指定train的label信息,最后一个指定得到的train_lmdb(这个不能添加路径,由程序自己创建文件夹,如果提前有这个文件夹会报错)。
执行成功截图:
在当前路径下得到train_lmdb文件,如图所示:
3.根据得到的lmdb格式文件train_lmdb得到均值文件
新建一个compute_image_mean.bat文件,代码内容为:
E:\caffe-master\Build\x64\Release\compute_image_mean.exe E:\caffe-master\data\signboard\train_lmdb mean.binaryproto
pause
具体意思大概看下就了解,不具体解释了。运行成功截图为:
在当前路径下得到的mean.binaryproto文件为:
4.接下来就准备网络模型的事情了(简单举个例子,我这里先采用的是cifar10的网络,接下来以这个为例)
先将examples下的cifar10拷贝一份命名为signboard,这里主要用到两个prototxt文件:
train_test.prototxt的内容需要做修改:(mean_file和source需要指定路径,另外我们是进行100分类,最后的output由10改为100)
这里需要注意,因为我们没有得到test_lmdb文件,这里需要把phase的TEST部分删除,只留下TRAIN部分。
然后再修改solver.prototxt文件:
因为训练过程中不包含测试集,所以这里需要把test部分注释,否则会出现“Unknown bottom blob 'data' (layer 'conv1',bottom index 0)”的错误。
错误截图为:
5.完成数据处理和网络模型后,就可以进行训练模型了,在caffe-master根目录下新建一个trian_signboard.bat文件,代码内容为:
.\Build\x64\Release\caffe.exe train --solver=.\examples\signboard\cifar10_quick_solver.prototxt
pause
在caffe-master根目录下执行这个.bat文件就可以训练了,开心的飞起~~训练过程截图为:
这只是初步的把分类实验跑起来,后期打算做数据增强和finetune操作。期待竞赛有个好成绩~~