Caffe: SSD模型
SSD模型配置(训练)与运行
参考博文:
1. * ssd模型配置及运行demo
2. * SSD: Signle Shot Detector 用于自然场景文字检测
3. SSD的配置安装与测试
4. * SSD: Single Shot MultiBox Detector检测单张图片
简介:
SSD基于Caffe框架实现,在Github上可以获得开源代码。SSD 是用来检测物体的,那么同样可以将 SSD 用来检测自然场景图像中的文字。
第一部分:安装SSD(caffe)
1、安装Git
终端输入:
sudo apt-get install git
2、安装SSD
在主文件下终端输入(即/home/***(您的服务器名字)这个目录):
git clone https://github.com/weiliu89/caffe.git cd caffe git checkout ssd(出现“分支”则说明copy-check成功)
会在examples目录下出现ssd项目
第二部分:配置SSD(caffe)
终端输入:
cd /home/**(您服务器的名字)/caffe
cp Makefile.config.example Makefile.config
打开Makefile.config,开始修改,保存退出;或者从之前caffe项目复制其配置文件到这里。
终端输入:
cd /home/**(您服务器的名字)/caffe mkdir build cd build # 下面的命令都在build目录下执行 cmake ..(cmake和..中间又一个空格) make all -j16("‐j16"是使用 CPU 的多核进行编译,可以极大地加速编译的速度) make pycaffe(编译pycaffe)
注:编译最新的caffe使用cudnn,其版本要求至少为v4,否则出错.[2017-02-21]
第三部分:下载数据文件
1、 预训练模型下载
下载地址:VGG_ILSVRC_16_layers_fc_reduced.caffemodel
在caffe/models文件夹下新建文件夹,命名为VGGNet,将刚刚下载下来的文件放入这个VGGNet文件夹当中
2、下载VOC2007和VOC2012数据集
在用户主目录下(即/home/**(您服务器的名字)/)新建data/目录
终端输入:
cd /home/**(您服务器的名字)/data wget http://host.robots.ox.ac.uk/pascal/VOC/voc2012/VOCtrainval_11-May-2012.tar wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtrainval_06-Nov-2007.tar wget http://host.robots.ox.ac.uk/pascal/VOC/voc2007/VOCtest_06-Nov-2007.tar
解压这三个文件,终端输入(请严格按照这个顺序解压):
cd /home/**(您服务器的名字)/data tar -xvf VOCtrainval_11-May-2012.tar tar -xvf VOCtrainval_06-Nov-2007.tar tar -xvf VOCtest_06-Nov-2007.tar
第四部分:生成LMDB文件
终端输入:
cd /home/**(您服务器的名字)/caffe ./data/VOC0712/create_list.sh ./data/VOC0712/create_data.sh
在运行第三步时如果出现no module named caffe或者是no module named caffe-proto,则在终端输入:
export PYTHONPATH=$PYTHONPATH:/home/**(您服务器的名字)/caffe/Python
然后再次运行
第五部分:训练测试演示
1、 训练
打开caffe/examples/ssd/ssd_pascal.py这个文件,找到gpus='0,1,2,3'这一行,如果您的服务器有一块显卡,则将123删去,如果有两个显卡,则删去23,以此类推。
如果您服务器没有gpu支持,则注销以下几行,程序会以cpu形式训练。(这个是解决问题cudasuccess(10vs0)的方法)
#Ifnum_gpus >0: # batch_size_per_device =int(math.ceil(float(batch_size) / num_gpus)) #iter_size =int(math.ceil(float(accum_batch_size) / (batch_size_per_device * num_gpus))) # solver_mode =P.Solver.GPU # device_id =int(gpulist[0])
保存后终端运行:
cd /home/**(您服务器的名字)/caffe python examples/ssd/ssd_pascal.py
如果出现问题cudasuccess(2vs0)则说明您的显卡计算量有限,则编辑文件 vim examples/ssd/ssd_pascal.py ,找到batch_size = 32这一行,修改数字32为16或8或4,保存后再次终端运行 python examples/ssd/ssd_pascal.py
注意,SSD模型训练过程中GPU显存需求略小于 8GB。这意味着4GB或6GB显存的GPU无法直接训练SSD[实验室配置为GT980,显存6GB,cudnn加速能力5],可以通过减小batchsize来绕过这个问题。
wang@VisInt:~$ nvidia-smi Tue Feb 21 17:30:36 2017 +------------------------------------------------------+ | NVIDIA-SMI 346.82 Driver Version: 346.82 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | |===============================+======================+======================| | 0 GeForce GTX 980 Ti Off | 0000:02:00.0 N/A | N/A | | 0% 37C P8 N/A / N/A | 48MiB / 6143MiB | N/A Default | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: GPU Memory | | GPU PID Type Process name Usage | |=============================================================================| | 0 C+G Not Supported | +-----------------------------------------------------------------------------+
2、 测试
终端输入:
python examples/ssd/score_ssd_pascal.py
演示detection的训练结果,数值在0.728左右
3、 用训练好的 model 进行 predict
>>演示网络摄像头识别效果,终端输入:
python examples/ssd/ssd_pascal_webcam.py
要求机器上有摄像头,Linux服务器桌面环境下运行命令
>>检测图片:
jupyter notebook
打开 ~/caffe/examples/ssd_detect.ipynb
指定好 caffemodel
要求在Linux服务器桌面环境下运行命令