目标检测相关
1 x 1卷积的作用:
1. 引入非线性:相当于全连接过程,加入非线性,增加了网络的非线性,使得网络可以表达更复杂的特性。
2. 特征降维: 对通道数进行放缩,减少参数,减小计算量。
如上图所示,加入1x1卷积后,计算量得到大大减少。
空洞卷积:可以获得更大的特征图,更加密集的数据,在相同的感受野下,更大的特征图有助于分割和检测更小的物体。
转置卷积:又称反卷积,不常用。
传统的目标检测:
采用的是滑动窗口法加传统机器学习分类(如SVM等),主要有以下几点问题:
1. 识别效果不够好,准确率不高
2. 计算量较大,运行速度慢
3. 可能会出现多个结果
采用滑动窗口法加CNN可以提高准确率,但速度甚至可能下降。
全卷积神经网络FCN(fully convolution network):
使用1x1卷积代替全连接层,其精髓在于可以输入任意大小的图片。
判断目标检测的质量好坏:
1. 交并比IoU intersection over union
IoU = Detection ∩ Truth / Detection ∪ Truth
一般将阈值设为≥0.5,大于阈值的叫做正样本,小于阈值的叫负样本
2. 平均准确率均值mAP mean average precision
最重要的指标,∈(0, 1),越大越好
对于分类问题的每一个类别都可以根据recall和precision绘制一条曲线,则AP就是该曲线下的面积,mAP就是多个类别AP的均值。
可以看出,recall越大,precision越小。