摘要:
前言 本文回顾了在大数据集上进行预训练的范式,并且提出了一种简单的方法 Scale up 了预训练的数据集,得到的模型获得了很好的下游任务的性能,作者称之为 Big Transfer (BiT)。BiT 只需要预训练一次,后续对下游任务的微调成本很低。 本文转载自极市平台 作者 | CV开发者都爱看 阅读全文
摘要:
前言 本文介绍了PP-LiteSeg,一个新的轻量级实时语义分割任务模型。作者提出了一个灵活和轻量级解码器(FLD)来减少以往解码器的计算开销。为了加强特征表示,作者还提出了一个统一的注意力融合模块(UAFM),它利用空间注意力和通道注意力产生一个注意力权重,然后将输入特征与权重融合。此外,还提出了 阅读全文
摘要:
前言 受最近对比学习范式的启发,作者团队首先提出一种无监督的退化表征学习策略,旨在利用对比学习和视觉注意力的最新进展,预训练一个退化表示编码器(DRE)。DRE 提取输入退化人脸图像的退化表征,作为全局条件指导恢复过程。此外,作者还提出了一种新的退化感知特征插值(DAFI)模块,可以根据退化表征动态 阅读全文
摘要:
前言 在三维世界当中,物体之间的相互遮挡非常常见。然而,如此常见的遮挡,却仍然是机器视觉系统在场景理解时的主要障碍。本文基于VGG组最新论文 A Tri-Layer Plugin to Improve Occluded Detection,为大家带来目标检测与实例分割任务当中遮挡物问题的最新进展。目 阅读全文
摘要:
前言 该文是华为诺亚方舟实验室 & INSA Lyon & Mila Montreal联合提出一种基于深度学习的图像增强方法。作者提出采用深度学习方法学习三种类型(椭圆滤波器、渐变滤波器、多项式滤波器)的空间局部滤波器用于图像增强。该文为深度学习算法在图像复原里面的应用提供了一个新思路,非常建议大家 阅读全文
摘要:
前言 目标检测一般包括分类和回归两个子任务。在模型训练的过程中,本文依据回归任务的预测结果动态分配分类任务的标签,同时利用分类任务的预测结果来分配回归任务的标签,以此达到相互指导、左右互搏的效果。 本文转载自计算机视觉研究院 作者 | Edison_G 欢迎关注公众号CV技术指南,专注于计算机视觉的 阅读全文
摘要:
前言 本文将回顾轻量级模型的最新工作:EfficientFormer 和 TinyViT,分别从模型设计原则和模型训练技巧两个方面,对轻量化基础模型展开了详细的探索。 本文转载自OpenMMLab 作者 | 带来新知识的 欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经典论文 阅读全文
摘要:
前言 在低纹理区域,传统的基于特征点的SfM/SLAM/三维重建算法很容易失败。因此很多算法会尝试去提取线特征来提高点特征的鲁棒性,典型操作就是LSD。但在一些带噪声的低光照环境下,LSD很容易失效。而且线特征检测的难点在于,由于遮挡,线端点的精确定位很难获得。本文给大家推荐一篇不错的线特征提取算法 阅读全文
摘要:
前言 现有的视觉特征金字塔方法过分集中于层间特征交互,而忽略了层内特征规则。一些方法试图借助注意力机制或视觉Transformer学习紧凑的层内特征表示,但它们忽略了对密集预测任务重要的被忽略的角区域。为了解决这个问题,在本文中提出了一种用于目标检测的集中特征金字塔(CFP),它基于全局显式集中特征 阅读全文
摘要:
前言 本文介绍了在单卡上凭借对YOLOv5的性能分析以及几个简单的优化将GTX 3090 FP32 YOLOv5s的训练速度提升了近20%。对于需要迭代300个Epoch的COCO数据集来说相比 ultralytics/yolov5 我们缩短了11.35个小时的训练时间。 本文转载自GiantPan 阅读全文