10 2017 档案

摘要:###0 - 背景 在经过了inception v1的基础上,google的人员还是觉得有维度约间的空间,在《Rethinking the Inception Architecture for Computer Vision》一文中,通过卷积分解、网格约间等方式来修改inception模块。当然了在 阅读全文
posted @ 2017-10-31 19:09 仙守 阅读(1771) 评论(0) 推荐(0) 编辑
摘要:###1 - 背景 摘要:因为随着前面层的参数的改变会导致后面层得到的输入数据的分布也会不断地改变,从而训练dnn变得麻烦。那么通过降低学习率和小心地参数初始化又会减慢训练过程,而且会使得具有饱和非线性模型的训练变得很困难。我们将这种现象叫做internal covariate shift。BN通过 阅读全文
posted @ 2017-10-28 10:39 仙守 阅读(530) 评论(0) 推荐(0) 编辑
摘要:###1 - V1 google团队在模型上,更多考虑的是实用性,也就是如何能让强大的深度学习模型能够用在嵌入式或者移动设备上。传统的想增强模型的方法无非就是深度和宽度,而如果简单的增加深度和宽度,那么带来的更大参数要训练和需要更强大的计算资源去计算。所以,google团队要做的就是如何在保证模型准 阅读全文
posted @ 2017-10-24 23:42 仙守 阅读(290) 评论(0) 推荐(0) 编辑
摘要:###0. AlexNet ###1. VGG VGG网络相对来说,结构简单,通俗易懂,作者通过分析2013年imagenet的比赛的最好模型,并发现感受野还是小的好,然后再加上《network in network》中的11卷积核,使得全文只在卷积网络的深度上做文章,从而得出了网络还是越深越 阅读全文
posted @ 2017-10-23 15:28 仙守 阅读(676) 评论(0) 推荐(0) 编辑
摘要:###0. AlexNet ###1. VGG VGG网络相对来说,结构简单,通俗易懂,作者通过分析2013年imagenet的比赛的最好模型,并发现感受野还是小的好,然后再加上《network in network》中的11卷积核,使得全文只在卷积网络的深度上做文章,从而得出了网络还是越深越 阅读全文
posted @ 2017-10-23 15:14 仙守 阅读(1939) 评论(0) 推荐(0) 编辑
摘要:###0 - 背景 从rcnn,spp,fast rcnn, faster rcnn,yolo,ssd,这里又有个新模型叫rfcn,即Region-based Fully Convolutional Networks,R-FCN。虽然其比yolo,ssd出来的晚,不过看模型结构,更多的是针对fast 阅读全文
posted @ 2017-10-22 19:49 仙守 阅读(12452) 评论(0) 推荐(1) 编辑
摘要:###0. 背景 经过了rcnn,spp,fast rcnn, faster rcnn,yolo,这里又到了ssd模型。 faster rcnn的贡献是将候选框区域提取的部分也集成到CNN中去,并且与对象的分类和候选框区域微调共享同一个基CNN,而其中还是存在需要做4步训练的方法(作者虽然后续也实现 阅读全文
posted @ 2017-10-22 12:10 仙守 阅读(608) 评论(0) 推荐(0) 编辑
摘要:这部分,写一写faster rcnn ###0. faster rcnn 经过了rcnn,spp,fast rcnn,又到了faster rcnn,作者在对前面的模型回顾中发现,fast rcnn提出的roi pooling 虽然解决的cnn网络在单张完整图重复计算的问题(每个由ss算法得到的区域候 阅读全文
posted @ 2017-10-21 22:13 仙守 阅读(488) 评论(0) 推荐(0) 编辑
摘要:近些年,随着DL的不断兴起,计算机视觉中的对象检测领域也随着CNN的广泛使用而大放异彩,其中Girshick等人的《R-CNN》是第一篇基于CNN进行对象检测的文献。本文欲通过自己的理解来记录这几大模型的发展。(自己挖坑,自己待填) ###0. overfeat ###0.1. MultiBox # 阅读全文
posted @ 2017-10-17 10:29 仙守 阅读(598) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示