11月深度学习班第5课图像物体检测:rcnn/fast-rcnn/faster-rcnn
部分代码与训练数据
R-CNN
(Cafffe + MATLAB): https://github.com/rbgirshick/rcnn (非常慢,看看就好)
Fast R-CNN
(Caffe + MATLAB): https://github.com/rbgirshick/fast-rcnn (非端到端)
Faster R-CNN
(Caffe + MATLAB): https://github.com/ShaoqingRen/faster_rcnn
(Caffe + Python): https://github.com/rbgirshick/py-faster-rcnn
SSD
(Caffe + Python)https://github.com/weiliu89/caffe/tree/ssd
R-FCN
(Caffe + Matlab) https://github.com/daijifeng001/R-FCN
(Caffe + Python) https://github.com/Orpine/py-R-FCN
rcnn:看作分类问题,算法的组合:候选框+卷积提取特征+svm分类
候选框是借用外来的方案,深度学习只是用来提取特征,分类是svm算法,所以不是端到端的方案
1:边缘策略,先根据图像像素之间的关系聚类得到很多的候选框,这部分有很多的方案,比如:selectivesearch
2:根据得到的候选框,分别在每一个候选框上面进行卷积运算
3:把每个候选框得到的卷积运算再分类即可
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
fast-rcnn
针对R-CNN的改进:共享图窗计算,从而加速
1:不是在每个候选框上面进行了卷积运算,而是在统一的进行卷积运算,加快了速度
2:分类不是svm了,而是使用全连接了,先FC然后softmax分类了
3:整个过程是端到端的,不再是组合的算法
----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
faster-rcnn
Region Proposal(候选图窗)一定要另外独立做吗?一起用RPN做完得了!
改进:候选框不再是另外的方案,而是使用了RPN
所以包含了4个损失函数
关于RPN:Region Proposal Network