随笔档案「2021年11月」 - CV技术指南（公众号）

ICCV2021 | Swin Transformer: 使用移位窗口的分层视觉Transformer

摘要：前言本文解读的论文是ICCV2021中的最佳论文，在短短几个月内，google scholar上有388引用次数，github上有6.1k star。本文来自公众号CV技术指南的论文分享系列关注公众号CV技术指南，专注于计算机视觉的技术总结、最新技术跟踪、经典论文解读。论文: Sw 阅读全文

posted @ 2021-11-28 15:29 CV技术指南（公众号）阅读(857) 评论(0) 推荐(0)

ICCV2021 | SOTR:使用transformer分割物体

摘要：前言本文介绍了现有实例分割方法的一些缺陷，以及transformer用于实例分割的困难，提出了一个基于transformer的高质量实例分割模型SOTR。经实验表明，SOTR不仅为实例分割提供了一个新的框架，还在MS Coco数据集上超过了SOTA实例分割方法。本文来自公众号CV技术指南的论阅读全文

posted @ 2021-11-26 12:28 CV技术指南（公众号）阅读(1360) 评论(0) 推荐(0)

ML2021 | (腾讯)PatrickStar：通过基于块的内存管理实现预训练模型的并行训练

摘要：前言目前比较常见的并行训练是数据并行，这是基于模型能够在一个GPU上存储的前提，而当这个前提无法满足时，则需要将模型放在多个GPU上。现有的一些模型并行方案仍存在许多问题，本文提出了一种名为PatrickStar的异构训练系统。PatrickStar通过以细粒度方式管理模型数据来更有效地使用异阅读全文

posted @ 2021-11-25 16:50 CV技术指南（公众号）阅读(580) 评论(0) 推荐(0)

ICCV2021 | PnP-DETR：用Transformer进行高效的视觉分析

摘要：前言 DETR首创了使用transformer解决视觉任务的方法，它直接将图像特征图转化为目标检测结果。尽管很有效，但由于在某些区域(如背景)上进行冗余计算，输入完整的feature maps的成本会很高。在这项工作中，论文将减少空间冗余的思想封装到一个新的轮询和池(Poll and Pool 阅读全文

posted @ 2021-11-23 15:12 CV技术指南（公众号）阅读(566) 评论(0) 推荐(0)

ICCV2021 | 医学影像等小数据集的非自然图像领域能否用transformer？

摘要：前言医学领域的数据集具有标注样本少、图像非自然的特点，transformer已经证明了在自然图像领域下的成功，而能否应用于医学领域等少量标注样本的非自然图像领域呢？本文研究比较了CNN和ViTs在三种不同初始化策略下在医学图像任务中的表现，研究了自监督预训练对医学图像领域的影响，并得出了三个阅读全文

posted @ 2021-11-21 11:27 CV技术指南（公众号）阅读(822) 评论(0) 推荐(0)

ICCV2021 | Vision Transformer中相对位置编码的反思与改进

摘要：前言在计算机视觉中，相对位置编码的有效性还没有得到很好的研究，甚至仍然存在争议，本文分析了相对位置编码中的几个关键因素，提出了一种新的针对2D图像的相对位置编码方法，称为图像RPE(IRPE)。本文来自公众号CV技术指南的论文分享系列关注公众号CV技术指南，专注于计算机视觉的技术总结、最新阅读全文

posted @ 2021-11-20 16:29 CV技术指南（公众号）阅读(1144) 评论(0) 推荐(0)

ICCV2021 | TransFER：使用Transformer学习关系感知的面部表情表征

摘要：前言人脸表情识别(FER)在计算机视觉领域受到越来越多的关注。本文介绍了一篇在人脸表情识别方向上使用Transformer来学习关系感知的ICCV2021论文，论文提出了一个TransFER模型，在几个FER基准数据集上取得了SOTA性能。本文来自公众号CV技术指南的论文分享系列关注公众号阅读全文

posted @ 2021-11-18 20:16 CV技术指南（公众号）阅读(1078) 评论(0) 推荐(1)

2021-视频监控中的多目标跟踪综述

摘要：本文来自一篇2021的论文，论文简要回顾了现有的SOTA模型和MOT算法、对多目标跟踪中的深度学习进行了讨论、介绍了评估方面的指标、数据集和基准结果，最后给出了结论。视频监控中的多目标跟踪(MTT)是一项重要而富有挑战性的任务，由于其在各个领域的潜在应用而引起了研究人员的广泛关注。多目标跟阅读全文

posted @ 2021-11-17 22:21 CV技术指南（公众号）阅读(1479) 评论(0) 推荐(1)

CVPR2021 | SETR: 使用 Transformer 从序列到序列的角度重新思考语义分割

摘要：前言本文介绍了一篇CVPR2021的语义分割论文，论文将语义分割视为序列到序列的预测任务，基于transformer作为编码器，介绍了三种解码器方式，选择其中效果最好的解码器方式与transformer编码器组成了一个新的SOTA模型--SETR。论文：Rethinking Semantic 阅读全文

posted @ 2021-11-04 15:59 CV技术指南（公众号）阅读(945) 评论(0) 推荐(0)

11 2021 档案

公告