03 2020 档案
摘要:论文提出Light Head R CNN,一个精简的two stage目标检测器设计准则,在表达能力很强的精简特征图上使用轻量级的R CNN子网,不仅大量减少推理耗时,还提高了准确率,结合Xception like的主干网络能够达到30.7mAP和102FPS 来源:【晓飞的算法工程笔记】 公众号
阅读全文
摘要:论文将搜索空间从整体网络转化为卷积单元(cell),再按照设定堆叠成新的网络家族NASNet。不仅降低了搜索的复杂度,从原来的28天缩小到4天,而且搜索出来的结构具有扩展性,在小模型和大模型场景下都能使用更少的参数量和计算量来超越人类设计的模型,达到SOTA 来源:【晓飞的算法工程笔记】 公众号 论
阅读全文
摘要:近年来很多研究将nlp中的attention机制融入到视觉的研究中,得到很不错的结果,于是,论文侧重于从理论和实验去验证self attention可以代替卷积网络独立进行类似卷积的操作,给self attention在图像领域的应用奠定基础 论文: On the Relationship betw
阅读全文
摘要:论文为Google Brain在16年推出的使用强化学习的Neural Architecture Search方法,该方法能够针对数据集搜索构建特定的网络,但需要800卡训练一个月时间。虽然论文的思路有很多改进的地方,但该论文为AutoML的经典之作,为后面很多的研究提供了思路,属于里程碑式的论文,
阅读全文
摘要:论文提出了类似于dropout作用的diversification block,通过抑制特征图的高响应区域来反向提高模型的特征提取能力,在损失函数方面,提出专注于top k类别的gradient boosting loss来优化训练过程,模型在ResNet 50上提升3.2%,算法思路巧妙,结构易移
阅读全文
摘要:论文提出了IoU based的DIoU loss和CIoU loss,以及建议使用DIoU NMS替换经典的NMS方法,充分地利用IoU的特性进行优化。并且方法能够简单地迁移到现有的算法中带来性能的提升,实验在YOLOv3上提升了5.91mAP,值得学习 论文:Distance IoU Loss:
阅读全文
摘要:作者从detector的overfitting at training/quality mismatch at inference问题入手,提出了基于multi stage的Cascade R CNN,该网络结构清晰,效果显著,并且能简单移植到其它detector中,带来2 4%的性能提升 论文:
阅读全文
摘要:常见的目标检测算法缺少了定位效果的学习,IoU Net提出IoU predictor、IoU guided NMS和Optimization based bounding box refinement,将IoU作为一个新分支融入到模型的学习和推理中,带来了新的性能优化方法,值得学习和参考 论文: A
阅读全文
摘要:论文基于RetinaNet提出了IoU aware sinage stage目标检测算法,该算法在regression branch接入IoU predictor head并通过加权分类置信度和IoU预测值得到anchor的最终分数,从实验结果看来,算法能有效提升定位的准确率 论文:IoU awar
阅读全文
摘要:论文分析了one stage网络训练存在的类别不平衡问题,提出能根据loss大小自动调节权重的focal loss,使得模型的训练更专注于困难样本。同时,基于FPN设计了RetinaNet,在精度和速度上都有不俗的表现 论文:Focal Loss for Dense Object Detection
阅读全文
摘要:论文提出Cascade RPN算法来提升RPN模块的性能,该算法重点解决了RPN在迭代时anchor和feature不对齐的问题,论文创新点足,效果也很惊艳,相对于原始的RPN提升13.4%AR 论文:Cascade RPN: Delving into High Quality Region Pro
阅读全文
摘要:论文提出CoAE少样本目标检测算法,该算法使用non local block来提取目标图片与查询图片间的对应特征,使得RPN网络能够准确的获取对应类别对象的位置,另外使用类似SE block的squeeze and co excitation模块来根据查询图片加强对应的特征纬度,最后结合margin
阅读全文
摘要:BlendMask通过更合理的blender模块融合top level和low level的语义信息来提取更准确的实例分割特征,该模型效果达到state of the art,但结构十分精简,推理速度也不慢,精度最高能到41.3AP,实时版本BlendMask RT性能和速度分别为34.2mAP和2
阅读全文