摘要: 如上图所示,这是一个图像金字塔,做CV的你肯定很熟悉,因为在很多的经典算法里面都有它的身影,比如SIFT、HOG等算法。我们常用的是高斯金字塔,所谓的高斯金字塔是通过高斯平滑和亚采样获得一些下采样图像,也就是说第K层高斯金字塔通过平滑、亚采样操作就可以获得K+1层高斯图像,高斯金字塔包含了一系列低通 阅读全文
posted @ 2020-03-13 17:32 纯洁的小兄弟 阅读(257) 评论(0) 推荐(0) 编辑
摘要: Faster RCNN其实可以分为4个主要内容: Conv layers。作为一种CNN网络目标检测方法,Faster RCNN首先使用一组基础的conv+relu+pooling层提取image的feature maps。该feature maps被共享用于后续RPN层和全连接层。 Region 阅读全文
posted @ 2020-03-13 17:25 纯洁的小兄弟 阅读(759) 评论(0) 推荐(0) 编辑
摘要: SPPnet出来之后,RBG大神迅速回怼,抛出了更快更好的Fast-RCNN。新的思路是, 将之前的多阶段训练合并成了单阶段训练,面对灵活尺寸问题,大神借鉴了空间金字塔的思路,使用了一层的空间金字塔。 摘要本文提出了一个快速的基于区域推荐的卷积网络方法(Fast R-CNN)用于对象检测。Fast 阅读全文
posted @ 2020-03-13 14:56 纯洁的小兄弟 阅读(1891) 评论(1) 推荐(1) 编辑
摘要: R-CNN的最大瓶颈是2k个候选区域都要经过一次CNN,速度非常慢。Kaiming He大神最先对此作出改进,提出了SPP-net,最大的改进是只需要将原图输入一次,就可以得到每个候选区域的特征。 概述 在R-CNN中,候选区域需要进过变形缩放,以此适应CNN输入,那么能不能修改网络结构,使得任意大 阅读全文
posted @ 2020-03-13 14:33 纯洁的小兄弟 阅读(204) 评论(0) 推荐(0) 编辑
摘要: 简单介绍(What)Ovefeat是2013年ImageNet定位任务的冠军,同时在分类和检测任务也取得了不错的结果。 它用一个共享的CNN来同时处理图像分类,定位,检测三个任务,可以提升三个任务的表现。 它用CNN有效地实现了一个多尺度的,滑动窗口的方法,来处理任务。 提出了一种方法,通过累积预测 阅读全文
posted @ 2020-03-13 14:24 纯洁的小兄弟 阅读(149) 评论(0) 推荐(0) 编辑
摘要: 这篇论文发布时间是 2014 年,它具有很多比较重要的意义。 在 Pascal VOC 2012 的数据集上,能够将目标检测的验证指标 mAP 提升到 53.3%,这相对于之前最好的结果提升了整整 30%.这篇论文证明了可以讲神经网络应用在自底向上的候选区域,这样就可以进行目标分类和目标定位。这篇论 阅读全文
posted @ 2020-03-13 14:06 纯洁的小兄弟 阅读(221) 评论(0) 推荐(0) 编辑
摘要: 这篇文章在MobileNet v2的基础上提出了一个新型的轻量级网络结构MobileNet v3。其是用NAS与NetAdapt两个算法搜索出来的。这篇文章针对MobileNet v3给出了两个版本的实现MobileNetV3-Large和MobileNetV3-Small,分别应对资源消耗高低的场 阅读全文
posted @ 2020-03-13 12:23 纯洁的小兄弟 阅读(2259) 评论(0) 推荐(0) 编辑
摘要: 1. 摘要 最近,神经网络的架构设计都是基于计算复杂度的间接度量,比如 FLOPs。然而,直接的度量比如运行速度,其实也会依赖于内存访问和平台特性等其它因素。 因此本文建议直接在目标平台上用直接度量进行测试。基于一系列控制条件实验,作者提出了设计高效网络结构的一些实用指导思想,并据此提出了一个称之为 阅读全文
posted @ 2020-03-13 12:15 纯洁的小兄弟 阅读(474) 评论(0) 推荐(0) 编辑
摘要: 一、SENet简介 Squeeze-and-Excitation Networks(SENet)是由自动驾驶公司Momenta在2017年公布的一种全新的图像识别结构,它通过对特征通道间的相关性进行建模,把重要的特征进行强化来提升准确率。这个结构是2017 ILSVR竞赛的冠军,top5的错误率达到 阅读全文
posted @ 2020-03-13 11:42 纯洁的小兄弟 阅读(1736) 评论(0) 推荐(0) 编辑
摘要: 本文的主要贡献点是一个构造了一个结构,称为the inverted residual with linear bottleneck。该结构与传统的residual block中维度先缩减后扩增相反,而是先将输入的低维feature map扩增到高维,然后用depthwise convolution方 阅读全文
posted @ 2020-03-13 11:20 纯洁的小兄弟 阅读(970) 评论(0) 推荐(0) 编辑
摘要: 1. 摘要 作者介绍了一种计算非常高效的 CNN 结构称之为 ShuffleNet,它是专门为计算资源非常有限的移动设备设计的。 这种新的结构主要用到了两种操作:分组点卷积(pointwise group convolution )和通道打乱(channel shuffle),这可以极大降低计算代价 阅读全文
posted @ 2020-03-13 11:09 纯洁的小兄弟 阅读(375) 评论(0) 推荐(0) 编辑
摘要: 我们提供一类称为MobileNets的高效模型,用于移动和嵌入式视觉应用。 MobileNets是基于一个流线型的架构,它使用深度可分离的卷积来构建轻量级的深层神经网络。我们引入两个简单的全局超参数,在延迟度和准确度之间有效地进行平衡。这两个超参数允许模型构建者根据问题的约束条件,为其应用选择合适大 阅读全文
posted @ 2020-03-13 10:14 纯洁的小兄弟 阅读(443) 评论(0) 推荐(0) 编辑
摘要: 核心贡献:从Inception的思想:剥离时序卷积和空域卷积 得到启发,提出了Xception(Extreme Inception),希望能彻底解耦二者。 其他贡献: 本文提供了关于Inception的一种解释。 讨论了与现有深度可分离卷积的区别,并指出其最大影响因素是两层卷积之间的非线性化。 在两 阅读全文
posted @ 2020-03-13 09:57 纯洁的小兄弟 阅读(1114) 评论(0) 推荐(1) 编辑
摘要: 首先作者介绍了在视觉领域中Attention也发挥着很大的作用,Attention不止能使得运算聚焦于特定区域,同时也可以使得该部分区域的特征得到增强,同时’very deep’的网络结构结合残差连接(Residual Network)在图像分类等任务中表现出了极好的性能。基于这两点考量,作者提出了 阅读全文
posted @ 2020-03-13 09:43 纯洁的小兄弟 阅读(436) 评论(0) 推荐(0) 编辑