随笔分类 - A-Object Detection
摘要:GFocal_loss简单总结 文章的主题很突出,针对一阶段目标检测领域的两个现存的表示问题进行分析,并提出合理的解决方案 论文链接 作者知乎解读链接 代码链接 问题1: 用法不一致,训练时分类与回归的head各自分开训练各自的,但是在推理的时候因为NMS的score,又把分类分数和框质量的分数相乘
阅读全文
摘要:MAP的计算方法 在计算MAP之前,要对TP/TN/FP/FN,precision/recall的计算有一定的了解。 一句话概括AP:recall在【0-1】范围内的平均precision值 一句话概括MAP:所有类别的平均AP 得出PR曲线 一般来说,p-r曲线是p越大,r越小;p越小,r越大,跟
阅读全文
摘要:voc数据集 voc,如上图 xmin ,ymin ,xmax, ymax bbox的坐标格式是box的左上角和右下角的坐标 坐标的方式是在第四象限,且x越往右越大,y越往下越大 coco数据集 x,y,w,h box左上角的坐标以及宽、高 图像送入网络之前通常进行的一步预处理,减去图像的均值,目的
阅读全文
摘要:任意角度的场景文本检测论文思路总结共同点:重新添加分支的创新更突出场景文本检测基于分割的检测方法 spcnet(mask_rcnn+tcm+rescore) psenet(渐进扩展) mask text spottor(新加分割分支) craft incepText 基于回归的检测方法: r2cnn
阅读全文
摘要:STN的主要思想是通过网络学习一个变化参数,然后计算出新图在原图上对应的坐标,再通过某种填充方法填充新图。 使得得到的新图很好的适应nn训练。可以理解为是拿来把不规范的图像变换为标准形式的图像。 网络结构图如下: 主要步骤分为以下三步: (1) Localisation net 计算出变化参数,是一
阅读全文
摘要:cornerNet来源灵感是基于多人姿态估计的从下往上思想,预测角的热图,根据嵌入式向量对角进行分组,其主干网络也来自于姿态估计的环面网络。 cornerNet的总体框架结构图如下: CornerNet 模型架构包含三部分:环面网络、右下角和左上角的热图、预测模块 环面网络同时包含多个从下往上(从高
阅读全文
摘要:代码参考自:https://github.com/DetectionTeamUCAS/FPN_Tensorflow 主要分析fpn多层金字塔结构的输出如何进行预测。 FPN金字塔结构插入在faster_rcnn的特征图获取之后,在rpn结构之前。 具体代码如下所示: 代码结构追溯至FPN部分: tr
阅读全文
摘要:1.roi pooling 将从rpn中得到的不同Proposal大小变为fixed_length output, 也就是将roi区域的卷积特征拆分成为H*W个网格,对每个网格进行maxpooling,然后就能得到固定大小的特征。 2.roi align 从原图的proposal映射回feature
阅读全文
摘要:Rotational region cnn 我们的目标是检测任意方向的场景文本,与RRPN类似,我们的网络也基于FasterR-CNN ,但我们采用不同的策略,而不是产生倾斜角度建议。 我们认为RPN有资格生成文本候选,并根据RPN提出的候选文本预测方向信息 检测步骤: 如图所示:a.原图片 b.通
阅读全文
摘要:多尺度检测(不同的idea) (特征金字塔)(空间金字塔池化)(带洞空间金字塔池化)(融合深浅层特征) 检测和分割中的例子 分割: sppnet中的spp空间金字塔池化结构;(spatial pyramid pooling) pspnet中的pyramid pooling moudle结构,综合讲是
阅读全文
摘要:成功的因素: 1.级联而非并联检测器 2.提升iou阈值训练级联检测器的同时不带来负面影响 核心思想: 区分正负样本的阈值u取值影响较大,加大iou阈值直观感受是可以增加准确率的,但是实际上不是,因为这时候正负样本不均衡,所以要做出改变; 所以得出的cascade R-CNN由一系列的检测模型组成,
阅读全文
摘要:RFCN的核心是通过修改roi pooling的位置,来增加共享参数的层,减少运算时间; roi pooling位置的影响如下: 越靠近 Input - 对应 ROI-Wise 检测子网越深,准确度也就越高; 越靠近 Output - 对应 ROI-Wise 子网越浅,针对每个 ROI 计算量就越小
阅读全文
摘要:iou 使用loU看检测是否正确需要设定一个阈值,最常用的阈值是0.5,即如果loU>0.5,则认为是真实的检测 P代表每张图像中被检测出的正确目标占总目标数的多少; AP代表对于一个类别,假如100张图像,计算平均精度;分子是图像的个数,分母是总精度的和; MAP=所有类别的平均精度求和除以所有类
阅读全文
摘要:目标检测主流方法有两大类 two-stage,以rcnn系列为主,采用建议框的方式对目标进行预测,过程首先要经过网络生成候选框,分类背景前景与进行第一次回归,之后再进行一次精细回归。 优点是准确率高,但速度较one-stage慢 one-stage,以yolo 、sdd等为主,通过事先制定先验框(对
阅读全文
摘要:YOLOV3 YOLO3主要的改进有:调整了网络结构;利用多尺度特征进行对象检测;对象分类用Logistic取代了softmax。 新的网络结构Darknet -53 darknet-53借用了resnet的思想,在网络中加入了残差模块,这样有利于解决深层次网络的梯度问题,每个残差模块由两个卷积层和
阅读全文
摘要:1,YOLOv1算法的简介 YOLO算法使用深度神经网络进行对象的位置检测以及分类,主要的特点是速度够快,而且准确率也很高,采用直接预测目标对象的边界框的方法,将候选区和对象识别这两个阶段合二为一, 与faster rcnn区分开来,是一刀流的检测方法。 Yolo算法不再是窗口滑动了,而是直接将原始
阅读全文
摘要:1,YOLOv1算法的简介 YOLO算法使用深度神经网络进行对象的位置检测以及分类,主要的特点是速度够快,而且准确率也很高,采用直接预测目标对象的边界框的方法,将候选区和对象识别这两个阶段合二为一, 与faster rcnn区分开来,是一刀流的检测方法。 Yolo算法不再是窗口滑动了,而是直接将原始
阅读全文
摘要:FPN就是所谓的金字塔结构的检测器,(Feature Pyramid Network) 把FPN融合到Faster rcnn中能够很大程度增加检测器对全图信息的认知, 在我的另一篇博客中对多尺度融合有较为详细的介绍,https://www.cnblogs.com/ywheunji/p/1102267
阅读全文
摘要:步骤一: 找到一个CNN分类模型 步骤二: 对于这个模型修改最后的分类层,为21类,去掉最后一个全连接层 步骤三: 根据选择性搜索提取图像的候选区域(框) 对于候选框修改大小以适应CNN输入,然后得出feature map即为提取到的特征 步骤四: 训练SVM分类器,对特定敏感区域进行分类,每个类别
阅读全文