摘要: 前言: 这是一篇19年何凯明发的论文,论文基于目标检测、实例分割和人体关键点检测三个方向进行了多项实验,比较了从零使用随机初始化开始训练与使用预训练进行fine-tuning的效果,并得出了一些结论。 在本文将介绍论文的主要思想,主要结论,一些细节和作者基于实验结论上的讨论。 论文: Rethink 阅读全文
posted @ 2021-05-07 12:22 CV技术指南(公众号) 阅读(373) 评论(0) 推荐(0) 编辑
摘要: 前言: transformer用于图像方面的应用逐渐多了起来,其主要做法是将图像进行分块,形成块序列,简单地将块直接丢进transformer中。然而这样的做法忽略了块之间的内在结构信息,为此,这篇论文提出了一种同时利用了块内部序列和块之间序列信息的transformer模型,称之为Transfor 阅读全文
posted @ 2021-05-04 16:22 CV技术指南(公众号) 阅读(594) 评论(0) 推荐(0) 编辑
摘要: 前言: 这是实例分割中的一篇经典论文,以往的实例分割模型都比较复杂,这篇论文提出了一个简单且直接的实例分割模型,如何设计这种简单直接的模型且要达到一定的精度往往会存在一些困难,论文中有很多思路或思想值得借鉴,因此十分值得一读。 在本文中,为让各个方向的读者都能看得懂并抓住重点,较为详细地介绍了本文的 阅读全文
posted @ 2021-04-29 23:52 CV技术指南(公众号) 阅读(586) 评论(0) 推荐(0) 编辑
摘要: 本文翻译自博客: 《Do We Really Need Model Compression?》 作者:Mitchell A. Gordon 前言: 模型压缩是一种缩小训练后的神经网络的技术。 压缩的模型在使用少量计算资源的情况下,其性能通常与原始模型相似。 但是,在许多应用程序中,瓶颈被证明是在压缩 阅读全文
posted @ 2021-04-21 21:36 CV技术指南(公众号) 阅读(250) 评论(0) 推荐(0) 编辑
摘要: 前言: 注意力机制在视觉上是非常重要的部分,这方面的综述、总结有很多。为了本文总结的全面性,我基本都看了一遍。然而这些综述要么面面俱到,对所有内容都非常详细地阐述,包括一些非常不常用的,过时的论文或结构;要么没分清重点,有些内容跟论文有关,但跟注意力无关,这些文章也把这些内容总结到里面。 什么是注意 阅读全文
posted @ 2021-04-16 21:54 CV技术指南(公众号) 阅读(1742) 评论(0) 推荐(0) 编辑
摘要: 前言: 最近几年,注意力机制用来提升模型性能有比较好的表现,大家都用得很舒服。本文将介绍一种新提出的坐标注意力机制,这种机制解决了SE,CBAM上存在的一些问题,产生了更好的效果,而使用与SE,CBAM同样简单。 论文地址: https://arxiv.org/pdf/2103.02907.pdf 阅读全文
posted @ 2021-04-08 20:34 CV技术指南(公众号) 阅读(2789) 评论(0) 推荐(0) 编辑
摘要: 论文地址:https://arxiv.org/abs/2103.11617 代码地址:https://github.com/daodaofr/AlignPS 前言: 本文针对anchor-free模型用于行人搜索中会出现三个不对齐问题:Scale misalignment,Region misali 阅读全文
posted @ 2021-04-05 21:58 CV技术指南(公众号) 阅读(704) 评论(0) 推荐(0) 编辑
摘要: 前言: 目前主流方向的模型基本都做到了很高的精度,你能想到的方法,基本上前人都做过了,并且还做得很好,因此越往后论文越来越难发,创新点越来越难找。 那如何寻找自己的创新点呢?如何在前人的基础上改进呢?在本文将提供几种思路。 思路 常见的思路我临时给它们取了几个名字:无事生非,后浪推前浪,推陈出新。 阅读全文
posted @ 2021-04-02 15:01 CV技术指南(公众号) 阅读(344) 评论(0) 推荐(0) 编辑
摘要: 前言: 特征金字塔是目前用于目标检测、语义分割、行为识别等方面比较重要的一个部分,对于提高模型性能具有非常好的表现。 不同大小的目标都经过了相同的降采样比例后会出现较大的语义代沟,最常见的表现就是小目标检测精度比较低。特征金字塔具有在不同尺度下有不同分辨率的特点,不同大小的目标都可以在相应的尺度下拥 阅读全文
posted @ 2021-03-30 23:21 CV技术指南(公众号) 阅读(2084) 评论(0) 推荐(1) 编辑
摘要: 论文:You Only Look One-level Feature 下载地址:https://arxiv.org/abs/2103.09460 代码: https://github.com/megvii-model/YOLOF Introduction 构建特征金字塔最普遍使用的方式是FPN,FP 阅读全文
posted @ 2021-03-27 09:03 CV技术指南(公众号) 阅读(649) 评论(0) 推荐(0) 编辑