摘要: RCNN对每个候选框都提取了特征,而且对于有重复区域的候选框们,这部分重复的区域相当于不断重复提取了特征,很麻烦。所以能不能只提取一次特征呢?也就是只卷积一次。 R-CNN对候选框尺寸进行了wrap, 全都改为227x227,改变尺寸势必会影响到检测效果,所以能不能不改变尺寸? 因此SPP提出的更新 阅读全文
posted @ 2019-08-24 20:43 Austin_anheqiao 阅读(195) 评论(0) 推荐(0) 编辑
摘要: 可以不进行特定样本下的微调吗?可以直接采用AlexNet CNN网络的特征进行SVM训练吗? 不针对特定任务进行微调,而将CNN当成特征提取器,pool5层得到的特征是基础特征,类似于HOG、SIFT,类似于只学习到了人脸共性特征;从fc6和fc7等全连接层中所学习到的特征是针对特征任务特定样本的特 阅读全文
posted @ 2019-08-24 20:04 Austin_anheqiao 阅读(265) 评论(0) 推荐(0) 编辑
摘要: 测试过程: 训练过程(不连续): 1、测试 1、建议框归一化方法 经过作者一系列实验表明采用padding=16的各向异性变形即下图第二行第三列效果最好,能使mAP提升3-5%。 2、CNN(alexnet)提取特征 AlexNet不用最后的全连接层,提取出1*1*4096维的特征向量。 3、训练分 阅读全文
posted @ 2019-08-24 15:59 Austin_anheqiao 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 目的是为了减少重叠框,例如: 同一个车辆目标会被多个建议框包围,这时需要非极大值抑制操作去除得分较低的候选框以减少重叠框。 实现: 将目标所有候选框根据得分从高到低进行排序,从最大得分的建议框开始,分别与后面的得分建议框进行IoU计算,若IoU>阈值,则剔除得分较小的建议框,否则认为图像中存在多个同 阅读全文
posted @ 2019-08-24 15:54 Austin_anheqiao 阅读(263) 评论(0) 推荐(0) 编辑
摘要: ImageNet有22K种共15M张高分辨率带标签图像,图像全被收集于网络,人工标记。 PASCAL VOC数据库 http://host.robots.ox.ac.uk/pascal/VOC/ 20类物体,简单,PASCAL VOC包括物体的类别标签和位置标签,一万图像,20类。 coco数据库 阅读全文
posted @ 2019-08-24 15:47 Austin_anheqiao 阅读(169) 评论(0) 推荐(0) 编辑
摘要: 交并比(Intersection-over-Union,IoU),目标检测中使用的一个概念,是产生的候选框(candidate bound)与原标记框(ground truth bound)的交叠率,即它们的交集与并集的比值。最理想情况是完全重叠,即比值为1。一般大于0.5就算成功了。 阅读全文
posted @ 2019-08-24 15:43 Austin_anheqiao 阅读(942) 评论(0) 推荐(0) 编辑
摘要: 如我们有一个分类任务,数据库很小,这时还是需要通过预训练来避免深度模型的过拟合问题的,只不过预训练是通过在一个大的数据库上(比如imagenet),通过有监督的训练来完成的。这种有监督预训练加小的数据库上微调的模式称为Transfer learning。 R-CNN是大样本下有监督预训练 + 小样本 阅读全文
posted @ 2019-08-24 15:24 Austin_anheqiao 阅读(715) 评论(0) 推荐(0) 编辑
摘要: 仿射变换是一种二维坐标(x,y)到二维坐标(u,v)的线性变换。 对应的齐次坐标矩阵表示形式为: 仿射变换特点: 直线经仿射变换后依然为直线; ’直线之间的相对位置关系保持不变,平行线经仿射变换后依然为平行线,且直线上点的位置顺序不会发生变化; 非共线的三对对应点确定一个唯一的仿射变换; 经仿射变换 阅读全文
posted @ 2019-08-24 15:17 Austin_anheqiao 阅读(5683) 评论(0) 推荐(0) 编辑
摘要: 传统的检测就是使用不同大小的窗口进行穷举,用分类器判断哪个窗口是目标。SS不想穷举,可以根据颜色、纹理的信息把图片分成不同的区域,这样就能够提取出大概包含目标的区域了,然后用这个粗略的区域在进行进一步的筛选。 问题: 1、要划分完全,不能漏掉,有的object之间是纹理不一样,有的是颜色不一样,单一 阅读全文
posted @ 2019-08-24 15:09 Austin_anheqiao 阅读(303) 评论(0) 推荐(0) 编辑