CV技术指南（公众号）

2023年3月8日

大卷积模型 + 大数据集 + 有监督训练！探寻ViT的前身：Big Transfer (BiT)

摘要：前言本文回顾了在大数据集上进行预训练的范式，并且提出了一种简单的方法 Scale up 了预训练的数据集，得到的模型获得了很好的下游任务的性能，作者称之为 Big Transfer (BiT)。BiT 只需要预训练一次，后续对下游任务的微调成本很低。本文转载自极市平台作者 | CV开发者都爱看阅读全文

posted @ 2023-03-08 11:11 CV技术指南（公众号）阅读(170) 评论(0) 推荐(0) 编辑

2023年3月7日

超快语义分割 | PP-LiteSeg集速度快、精度高、易部署等优点于一身，必会模型！！！

摘要：前言本文介绍了PP-LiteSeg，一个新的轻量级实时语义分割任务模型。作者提出了一个灵活和轻量级解码器(FLD)来减少以往解码器的计算开销。为了加强特征表示，作者还提出了一个统一的注意力融合模块(UAFM)，它利用空间注意力和通道注意力产生一个注意力权重，然后将输入特征与权重融合。此外，还提出了阅读全文

posted @ 2023-03-07 15:11 CV技术指南（公众号）阅读(419) 评论(0) 推荐(0) 编辑

AAAI | Panini-Net | 基于GAN先验的退化感知特征插值人脸修复

摘要：前言受最近对比学习范式的启发，作者团队首先提出一种无监督的退化表征学习策略，旨在利用对比学习和视觉注意力的最新进展，预训练一个退化表示编码器（DRE）。DRE 提取输入退化人脸图像的退化表征，作为全局条件指导恢复过程。此外，作者还提出了一种新的退化感知特征插值（DAFI）模块，可以根据退化表征动态阅读全文

posted @ 2023-03-07 10:53 CV技术指南（公众号）阅读(105) 评论(0) 推荐(0) 编辑

2023年3月6日

数据集+插件，一把子解决遮挡下目标检测难题

摘要：前言在三维世界当中，物体之间的相互遮挡非常常见。然而，如此常见的遮挡，却仍然是机器视觉系统在场景理解时的主要障碍。本文基于VGG组最新论文 A Tri-Layer Plugin to Improve Occluded Detection，为大家带来目标检测与实例分割任务当中遮挡物问题的最新进展。目阅读全文

posted @ 2023-03-06 21:12 CV技术指南（公众号）阅读(337) 评论(0) 推荐(0) 编辑

2023年3月5日

图像增强新思路：DeepLPF

摘要：前言该文是华为诺亚方舟实验室 & INSA Lyon & Mila Montreal联合提出一种基于深度学习的图像增强方法。作者提出采用深度学习方法学习三种类型(椭圆滤波器、渐变滤波器、多项式滤波器)的空间局部滤波器用于图像增强。该文为深度学习算法在图像复原里面的应用提供了一个新思路，非常建议大家阅读全文

posted @ 2023-03-05 15:57 CV技术指南（公众号）阅读(222) 评论(0) 推荐(0) 编辑

LCCL网络：相互指导博弈来提升目标检测精度（附源代码）

摘要：前言目标检测一般包括分类和回归两个子任务。在模型训练的过程中，本文依据回归任务的预测结果动态分配分类任务的标签，同时利用分类任务的预测结果来分配回归任务的标签，以此达到相互指导、左右互搏的效果。本文转载自计算机视觉研究院作者 | Edison_G 欢迎关注公众号CV技术指南，专注于计算机视觉的阅读全文

posted @ 2023-03-05 14:35 CV技术指南（公众号）阅读(62) 评论(0) 推荐(0) 编辑

一文带你掌握轻量化模型设计原则和训练技巧！

摘要：前言本文将回顾轻量级模型的最新工作：EfficientFormer 和 TinyViT，分别从模型设计原则和模型训练技巧两个方面，对轻量化基础模型展开了详细的探索。本文转载自OpenMMLab 作者 | 带来新知识的欢迎关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文阅读全文

posted @ 2023-03-05 14:34 CV技术指南（公众号）阅读(669) 评论(0) 推荐(0) 编辑

2023年3月3日

DeepLSD：基于深度图像梯度的线段检测和细化

摘要：前言在低纹理区域，传统的基于特征点的SfM/SLAM/三维重建算法很容易失败。因此很多算法会尝试去提取线特征来提高点特征的鲁棒性，典型操作就是LSD。但在一些带噪声的低光照环境下，LSD很容易失效。而且线特征检测的难点在于，由于遮挡，线端点的精确定位很难获得。本文给大家推荐一篇不错的线特征提取算法阅读全文

posted @ 2023-03-03 11:52 CV技术指南（公众号）阅读(659) 评论(0) 推荐(0) 编辑

摘要：前言现有的视觉特征金字塔方法过分集中于层间特征交互，而忽略了层内特征规则。一些方法试图借助注意力机制或视觉Transformer学习紧凑的层内特征表示，但它们忽略了对密集预测任务重要的被忽略的角区域。为了解决这个问题，在本文中提出了一种用于目标检测的集中特征金字塔（CFP），它基于全局显式集中特征阅读全文

posted @ 2023-03-03 10:48 CV技术指南（公众号）阅读(536) 评论(0) 推荐(1) 编辑

2023年3月2日

消费级显卡的春天，GTX 3090 YOLOv5s单卡完整训练COCO数据集缩短11.35个小时

摘要：前言本文介绍了在单卡上凭借对YOLOv5的性能分析以及几个简单的优化将GTX 3090 FP32 YOLOv5s的训练速度提升了近20%。对于需要迭代300个Epoch的COCO数据集来说相比 ultralytics/yolov5 我们缩短了11.35个小时的训练时间。本文转载自GiantPan 阅读全文

posted @ 2023-03-02 14:05 CV技术指南（公众号）阅读(865) 评论(0) 推荐(0) 编辑

公告