神经网络-RCNN

r-cnn

cnn对于图片分类的效果已经经过检验，各种利用cnn对图片分类的例子，lenet,cifir10,,,但是对于计算机视觉的另一个问题“目标检测”（从一幅图片中检测出各种物体，标注位置）卷积神经能否解决？

基于这个问题有人提出了R-cnn是将CNN方法引入目标检测领域，大大提高了目标检测效果，可以说改变了目标检测领域的主要研究思路!

网络架构简介：

　　在经典的CNN网络后接svm分类器，使用cnn提取特征，使用svm对图片特征分类（有经验数据表示，svm比cnn全链接层分类的效果更好）！

主要步骤：

训练阶段：

　　1、标注图片（自己对这个工作已经很熟了！）

　　2、使用Selective Search算法生成候选区，Selective Search算法基于曾经使用过的“图论分割算法”，对每幅图片生成大概2k个候选区域（以外围矩形表示）

　　使用精度评价公式：IOU对每个候选框判断候选区的类别（目标物体N or 背景）。

　　一张照片我们得到了2000个候选框。然而人工标注的数据一张图片中就只标注了正确的bounding box，2000个矩形框也不可能会出现一个与人工标注完全匹配的候选框。因此在CNN阶段我们需要用IOU为2000个bounding box打标签。如果用selective search挑选出来的候选框与物体的人工标注矩形框（PASCAL VOC的图片都有人工标注）的重叠区域IoU大于0.5，那么我们就把这个候选框标注成物体类别（正样本），否则我们就把它当做背景类别（负样本）。

　　3、使用CNN网络训练，并提取（存储）特征。

　　直接用Alexnet的网络，然后连参数也是直接采用它的参数，作为初始的参数值，然后再fine-tuning训练。