windows+caffe(五)——实例2MNIST图片

1. 数据集

MNIST手写体数据.bmp图片:训练集60K张28*28的,测试集10K张28*28的;

训练集:

 

测试集:

 

下载地址:

2. 读取图片名称与标签,保存到trainlist.txt与testlist.txt

matlab代码:

(1)读取train

 改为自己的数据url

clc

%% 读取文件夹里的图片名称,且将图片名保存到txt
file_path = 'D:\deeptools\caffe-windows-master\data\mnist\train-images\';
img_path_list = dir(strcat(file_path,'*.bmp'));
img_num = length(img_path_list);
 fp = fopen('train.txt','wt');
if img_num > 0 %有满足条件的图像
        for j = 1:img_num %逐一读取图像
            image_name = img_path_list(j).name;% 图像名
           
            fprintf(fp,'%s %d\n',image_name,str2num(image_name(1)));
%             csvwrite('train.txt',image_name)

%             image =  imread(strcat(file_path,image_name));
%             fprintf('%d %d %s\n',i,j,strcat(file_path,image_name));% 显示正在处理的图像名
            %图像处理过程 省略
        end
end

结果(部分)是:

 

(2)val代码

    改为自己的test数据URL;

clc

%% 读取文件夹里的图片名称,且将图片名保存到txt
file_path = 'D:\deeptools\caffe-windows-master\data\mnist\t10k-images\';
img_path_list = dir(strcat(file_path,'*.bmp'));
img_num = length(img_path_list);
 fp = fopen('test.txt','wt');
if img_num > 0 %有满足条件的图像
        for j = 1:img_num %逐一读取图像
            image_name = img_path_list(j).name;% 图像名
           
            fprintf(fp,'%s %d\n',image_name,str2num(image_name(1)));
%             csvwrite('train.txt',image_name)

%             image =  imread(strcat(file_path,image_name));
%             fprintf('%d %d %s\n',i,j,strcat(file_path,image_name));% 显示正在处理的图像名
            %图像处理过程 省略
        end
end

  部分结果为:

 

(3) test代码

  改为自己的test数据URL;

clc

%% 读取文件夹里的图片名称,且将图片名保存到txt
file_path = 'D:\deeptools\caffe-windows-master\data\mnist\t10k-images\';
img_path_list = dir(strcat(file_path,'*.bmp'));
img_num = length(img_path_list);
 fp = fopen('test.txt','wt');
if img_num > 0 %有满足条件的图像
        for j = 1:img_num %逐一读取图像
            image_name = img_path_list(j).name;% 图像名
           
            fprintf(fp,'%s\n',image_name);
%             csvwrite('train.txt',image_name)

%             image =  imread(strcat(file_path,image_name));
%             fprintf('%d %d %s\n',i,j,strcat(file_path,image_name));% 显示正在处理的图像名
            %图像处理过程 省略
        end
end

结果为:

 

3. 现在将数据转变为lmdb格式储存

 (1)我们新建一个train_lmdb文件夹(反正是如果我不事先建立这个文件夹就会出错,如下图)

和一个convert.bat文件,里面写入

D:/deeptools/caffe-windows-master/bin/convert_imageset.exe --shuffle D:/deeptools/caffe-windows-master/data/mnist/train-images/ D:/deeptools/caffe-windows-master/examples/mymnist/train.txt D:/deeptools/caffe-windows-master/examples/mymnist/train_lmdb
pause

  我们使用了--shuffle:意思是随机打乱图片顺序

结果是在新建的train_lmdb文件夹里新生成了这两个文件:

为了确定你成功了,最好看一下生成的log文件夹里以INF开头的看看里面的图片总数是不是你的图片数量。

(2)同上一样得到val_lmdb 

 

4.求得均值——

图片减去均值后,再进行训练和测试,会提高速度和精度。因此,一般在各种模型中都会有这个操作。

那么这个均值怎么来的呢,实际上就是计算所有训练样本的平均值,计算出来后,保存为一个均值文件,在以后的测试中,就可以直接使用这个均值来相减,而不需要对测试图片重新计算。

 新建ComputeImageMean.bat,里面输入

D:/deeptools/caffe-windows-master/bin/compute_image_mean.exe D:/deeptools/caffe-windows-master/examples/mymnist/train_lmdb D:/deeptools/caffe-windows-master/examples/mymnist/mean.binaryproto 
pause 

结果:

 

至于转换成leveldb格式和用这个格式求均值都可以从我的另一篇看到。。

 

5.现在我们仔细编写一下solve.prototxt与train_test.prototxt

因操作失误,现在链接不上远程 待续。。。。。

posted @ 2016-08-24 17:13  double-vane  阅读(1341)  评论(0编辑  收藏  举报