CV技术指南（公众号）

2021年12月23日

摘要：前言本文介绍一个Pytorch模型的静态分析器 PyTea，它不需要运行代码，即可在几秒钟之内扫描分析出模型中的张量形状错误。文末附使用方法。本文转载自机器之心编辑：CV技术指南关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。张量形状不匹阅读全文

posted @ 2021-12-23 20:39 CV技术指南（公众号）阅读(214) 评论(0) 推荐(0) 编辑

2021年12月21日

ICCV2021 | Tokens-to-Token ViT:在ImageNet上从零训练Vision Transformer

摘要：前言本文介绍一种新的tokens-to-token Vision Transformer(T2T-ViT)，T2T-ViT将原始ViT的参数数量和MAC减少了一半，同时在ImageNet上从头开始训练时实现了3.0%以上的改进。通过直接在ImageNet上进行训练，它的性能也优于ResNet，阅读全文

posted @ 2021-12-21 22:45 CV技术指南（公众号）阅读(694) 评论(0) 推荐(0) 编辑

2021年12月13日

ICCV2021 | 简单有效的长尾视觉识别新方案：蒸馏自监督(SSD)

摘要：前言本文提出了一种概念上简单但特别有效的长尾视觉识别的多阶段训练方案，称为蒸馏自监督(Self Supervision to Distillation, SSD)。在三个长尾识别基准：ImageNet-LT、CIFAR100-LT和iNaturist 2018上取得了SOTA结果。在不同的数据阅读全文

posted @ 2021-12-13 11:13 CV技术指南（公众号）阅读(795) 评论(0) 推荐(0) 编辑

2021年12月10日

ICCV2021 | 用于视觉跟踪的学习时空型transformer

摘要：前言本文介绍了一个端到端的用于视觉跟踪的transformer模型，它能够捕获视频序列中空间和时间信息的全局特征依赖关系。在五个具有挑战性的短期和长期基准上实现了SOTA性能，具有实时性，比Siam R-CNN快6倍。本文来自公众号CV技术指南的论文分享系列关注公众号CV技术指南，专注于阅读全文

posted @ 2021-12-10 21:11 CV技术指南（公众号）阅读(800) 评论(0) 推荐(0) 编辑

2021年12月7日

ICCV2021 | TOOD：任务对齐的单阶段目标检测

摘要：前言单阶段目标检测通常通过优化目标分类和定位两个子任务来实现，使用具有两个平行分支的头部，这可能会导致两个任务之间的预测出现一定程度的空间错位。本文提出了一种任务对齐的一阶段目标检测(TOOD)，它以基于学习的方式显式地对齐这两个任务。 TOOD在MS-CoCO上实现了51.1Ap的单模型单尺度阅读全文

posted @ 2021-12-07 19:53 CV技术指南（公众号）阅读(1202) 评论(0) 推荐(0) 编辑

2021年12月3日

计算机视觉中的transformer模型创新思路总结

摘要：前言本文回顾了ViT的结构，总结了计算机视觉中的transformer的主要改进思路：改进分块，改进位置编码，改进Encoder，增加Decoder。每个思路下都介绍了相关的论文，介绍了这些论文的提出出发点和改进思路。本文的目的不在于介绍transformer现在有哪些模型，而在于学习借鉴别阅读全文

posted @ 2021-12-03 18:38 CV技术指南（公众号）阅读(887) 评论(0) 推荐(0) 编辑

2021年12月1日

ICCV2021 | 渐进采样式Vision Transformer

摘要：前言 ViT通过简单地将图像分割成固定长度的tokens，并使用transformer来学习这些tokens之间的关系。tokens化可能会破坏对象结构，将网格分配给背景等不感兴趣的区域，并引入干扰信号。为了缓解上述问题，本文提出了一种迭代渐进采样策略来定位区分区域。在每次迭代中，当前采样步骤阅读全文

posted @ 2021-12-01 17:19 CV技术指南（公众号）阅读(257) 评论(0) 推荐(0) 编辑

2021年11月28日

ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer

摘要：前言本文解读的论文是ICCV2021中的最佳论文，在短短几个月内，google scholar上有388引用次数，github上有6.1k star。本文来自公众号CV技术指南的论文分享系列关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。论文: Sw 阅读全文

posted @ 2021-11-28 15:29 CV技术指南（公众号）阅读(671) 评论(0) 推荐(0) 编辑

2021年11月26日

ICCV2021 | SOTR:使用transformer分割物体

摘要：前言本文介绍了现有实例分割方法的一些缺陷，以及transformer用于实例分割的困难，提出了一个基于transformer的高质量实例分割模型SOTR。经实验表明，SOTR不仅为实例分割提供了一个新的框架，还在MS Coco数据集上超过了SOTA实例分割方法。本文来自公众号CV技术指南的论阅读全文

posted @ 2021-11-26 12:28 CV技术指南（公众号）阅读(1166) 评论(0) 推荐(0) 编辑

2021年11月25日

ML2021 | (腾讯)PatrickStar：通过基于块的内存管理实现预训练模型的并行训练

摘要：前言目前比较常见的并行训练是数据并行，这是基于模型能够在一个GPU上存储的前提，而当这个前提无法满足时，则需要将模型放在多个GPU上。现有的一些模型并行方案仍存在许多问题，本文提出了一种名为PatrickStar的异构训练系统。PatrickStar通过以细粒度方式管理模型数据来更有效地使用异阅读全文

posted @ 2021-11-25 16:50 CV技术指南（公众号）阅读(497) 评论(0) 推荐(0) 编辑

公告