上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 48 下一页
摘要: ​ 前言 本文提出了一种概念上简单但特别有效的长尾视觉识别的多阶段训练方案,称为蒸馏自监督(Self Supervision to Distillation, SSD)。在三个长尾识别基准:ImageNet-LT、CIFAR100-LT和iNaturist 2018上取得了SOTA结果。在不同的数据 阅读全文
posted @ 2021-12-13 11:13 CV技术指南(公众号) 阅读(725) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 本文介绍了一个端到端的用于视觉跟踪的transformer模型,它能够捕获视频序列中空间和时间信息的全局特征依赖关系。在五个具有挑战性的短期和长期基准上实现了SOTA性能,具有实时性,比Siam R-CNN快6倍。 本文来自公众号CV技术指南的论文分享系列 关注公众号CV技术指南 ,专注于 阅读全文
posted @ 2021-12-10 21:11 CV技术指南(公众号) 阅读(720) 评论(0) 推荐(0) 编辑
摘要: ​前言 单阶段目标检测通常通过优化目标分类和定位两个子任务来实现,使用具有两个平行分支的头部,这可能会导致两个任务之间的预测出现一定程度的空间错位。本文提出了一种任务对齐的一阶段目标检测(TOOD),它以基于学习的方式显式地对齐这两个任务。 TOOD在MS-CoCO上实现了51.1Ap的单模型单尺度 阅读全文
posted @ 2021-12-07 19:53 CV技术指南(公众号) 阅读(1043) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 本文回顾了ViT的结构,总结了计算机视觉中的transformer的主要改进思路:改进分块,改进位置编码,改进Encoder,增加Decoder。每个思路下都介绍了相关的论文,介绍了这些论文的提出出发点和改进思路。 本文的目的不在于介绍transformer现在有哪些模型,而在于学习借鉴别 阅读全文
posted @ 2021-12-03 18:38 CV技术指南(公众号) 阅读(789) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 ViT通过简单地将图像分割成固定长度的tokens,并使用transformer来学习这些tokens之间的关系。tokens化可能会破坏对象结构,将网格分配给背景等不感兴趣的区域,并引入干扰信号。 为了缓解上述问题,本文提出了一种迭代渐进采样策略来定位区分区域。在每次迭代中,当前采样步骤 阅读全文
posted @ 2021-12-01 17:19 CV技术指南(公众号) 阅读(214) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 本文解读的论文是ICCV2021中的最佳论文,在短短几个月内,google scholar上有388引用次数,github上有6.1k star。 本文来自公众号CV技术指南的论文分享系列 关注公众号CV技术指南 ,专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。 ​ 论文: Sw 阅读全文
posted @ 2021-11-28 15:29 CV技术指南(公众号) 阅读(625) 评论(0) 推荐(0) 编辑
摘要: ​前言 本文介绍了现有实例分割方法的一些缺陷,以及transformer用于实例分割的困难,提出了一个基于transformer的高质量实例分割模型SOTR。 经实验表明,SOTR不仅为实例分割提供了一个新的框架,还在MS Coco数据集上超过了SOTA实例分割方法。 本文来自公众号CV技术指南的论 阅读全文
posted @ 2021-11-26 12:28 CV技术指南(公众号) 阅读(1112) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 目前比较常见的并行训练是数据并行,这是基于模型能够在一个GPU上存储的前提,而当这个前提无法满足时,则需要将模型放在多个GPU上。现有的一些模型并行方案仍存在许多问题,本文提出了一种名为PatrickStar的异构训练系统。PatrickStar通过以细粒度方式管理模型数据来更有效地使用异 阅读全文
posted @ 2021-11-25 16:50 CV技术指南(公众号) 阅读(470) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 DETR首创了使用transformer解决视觉任务的方法,它直接将图像特征图转化为目标检测结果。尽管很有效,但由于在某些区域(如背景)上进行冗余计算,输入完整的feature maps的成本会很高。 在这项工作中,论文将减少空间冗余的思想封装到一个新的轮询和池(Poll and Pool 阅读全文
posted @ 2021-11-23 15:12 CV技术指南(公众号) 阅读(423) 评论(0) 推荐(0) 编辑
摘要: ​ 前言 医学领域的数据集具有标注样本少、图像非自然的特点,transformer已经证明了在自然图像领域下的成功,而能否应用于医学领域等少量标注样本的非自然图像领域呢? 本文研究比较了CNN和ViTs在三种不同初始化策略下在医学图像任务中的表现,研究了自监督预训练对医学图像领域的影响,并得出了三个 阅读全文
posted @ 2021-11-21 11:27 CV技术指南(公众号) 阅读(638) 评论(0) 推荐(0) 编辑
上一页 1 ··· 33 34 35 36 37 38 39 40 41 ··· 48 下一页