摘要:
前言: 前面分享了一篇《继SE,CBAM后的一种新的注意力机制Coordinate Attention》,其出发点在于SE只引入了通道注意力,CBAM的空间注意力只考虑了局部区域的信息,从而提出考虑全局空间信息的注意力机制。 在本文,将介绍另一个基于同样出发点的注意力模块,即Pyramid Sp 阅读全文
摘要:
前言: 在计算机视觉中存在很多的专业术语,如先验知识,语义信息,embedding,head,neck等。这些术语的解释无法直接在网上搜到,也没有在哪一篇论文中定义它们的概念和意义,因此,对于第一次听到这些术语的读者来说会非常的困惑。 此外,对于还没有建立计算机视觉知识体系的读者来说,也很难理解 阅读全文
摘要:
前言: 机器学习的模式是通过大量的数据喂给一个模型,模型会根据数据不断调整自身参数,最终具备判别这些数据的模式或特征的能力。若模型无法从这些数据中训练出一个很好的效果,则认为它是欠拟合。若模型在训练的时候达到很好的效果,而在未参与训练的数据上测试,效果不好,则认为它是过拟合。 在本文,将介绍欠拟合与 阅读全文
摘要:
把公众号的资源整理了以下,在公众号CV技术指南中回复以下关键字可免费获取。 若链接有失效请留言提醒我更新。 1.CV技术总结系列的所有文章合集--《CV技术指南》 回复“技术总结” 2.计算机视觉入门资料合集 回复“入门指南” 3.计算机视觉方向电子版书合集 回复“电子版资料” 4.经典网络、轻 阅读全文
摘要:
前言: 在很多情况下,我们想实现一个模型来跑自己的一个任务,但不得不做很多重复的工作,例如图像预处理,搭建网络,可视化输出,计算推理时间等。 商汤贡献了MMdetection项目, Facebook开源了detectron项目,它们把搭建一个模型所需要的一系列工作进行整合,实现了较为简单的方式去搭建 阅读全文
摘要:
前言: 对于任何想要创建可扩展服务的人来说,部署大内存的深度学习算法是一项挑战。 从长远来看,云服务是昂贵的。 在边缘设备上离线部署模型更便宜,并且还有其他好处。 唯一的缺点是它们缺乏内存和计算能力。 本文探讨了一些可用于在内存受限设置中拟合神经网络的技术。 不同的技术用于“训练”和“推理”阶段,因 阅读全文
摘要:
前言: 归一化相关技术已经经过了几年的发展,目前针对不同的应用场合有相应的方法,在本文将这些方法做了一个总结,介绍了它们的思路,方法,应用场景。主要涉及到:LRN,BN,LN, IN, GN, FRN, WN, BRN, CBN, CmBN等。 本文又名“BN和它的后浪们”,是因为几乎在BN后出现的 阅读全文
摘要:
前言: 在计算机视觉的论文中,常常看到一个部分是Ablation Study(消融研究)。这个部分想表达什么意思呢?有什么作用? quora上关于消融研究的解释:消融研究通常是指删除模型或算法的某些“功能”,并查看其如何影响性能。 在论文中一般来说会提出多个创新方法,或者新型结构模块,或注意力模块等 阅读全文
摘要:
知识蒸馏是一种在繁琐的模型中提炼知识并将其压缩为单个模型的方法,以便可以将其部署到实际应用中。AI的教父Geoffrey Hinton和他在Google的两个同事Oriol Vinyals和Jeff Dean于2015年引入了知识蒸馏。 知识蒸馏是指将笨拙的模型(教师)的学习行为转移到较小的模型 阅读全文
摘要:
前言: 上一篇从社会的角度聊了聊我对计算机视觉未来走向的看法,提出的主要观点是未来计算机视觉需要扩展应用领域,研发新产品,去更好地为社会服务。具体而言,它可以与机器人、嵌入式设备和移动端结合,因此需要做到模型小型化、专一化和轻量化。 如何看待计算机视觉未来的走向 在这篇,接着这个观点从产品的角度聊一 阅读全文