上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 25 下一页
摘要: ###0. AlexNet ###1. VGG VGG网络相对来说,结构简单,通俗易懂,作者通过分析2013年imagenet的比赛的最好模型,并发现感受野还是小的好,然后再加上《network in network》中的$1*1$卷积核,使得全文只在卷积网络的深度上做文章,从而得出了网络还是越深越 阅读全文
posted @ 2017-10-23 15:28 仙守 阅读(664) 评论(0) 推荐(0) 编辑
摘要: ###0. AlexNet ###1. VGG VGG网络相对来说,结构简单,通俗易懂,作者通过分析2013年imagenet的比赛的最好模型,并发现感受野还是小的好,然后再加上《network in network》中的$1*1$卷积核,使得全文只在卷积网络的深度上做文章,从而得出了网络还是越深越 阅读全文
posted @ 2017-10-23 15:14 仙守 阅读(1923) 评论(0) 推荐(0) 编辑
摘要: ###0 - 背景 从rcnn,spp,fast rcnn, faster rcnn,yolo,ssd,这里又有个新模型叫rfcn,即Region-based Fully Convolutional Networks,R-FCN。虽然其比yolo,ssd出来的晚,不过看模型结构,更多的是针对fast 阅读全文
posted @ 2017-10-22 19:49 仙守 阅读(12421) 评论(0) 推荐(1) 编辑
摘要: ###0. 背景 经过了rcnn,spp,fast rcnn, faster rcnn,yolo,这里又到了ssd模型。 faster rcnn的贡献是将候选框区域提取的部分也集成到CNN中去,并且与对象的分类和候选框区域微调共享同一个基CNN,而其中还是存在需要做4步训练的方法(作者虽然后续也实现 阅读全文
posted @ 2017-10-22 12:10 仙守 阅读(605) 评论(0) 推荐(0) 编辑
摘要: 这部分,写一写faster rcnn ###0. faster rcnn 经过了rcnn,spp,fast rcnn,又到了faster rcnn,作者在对前面的模型回顾中发现,fast rcnn提出的roi pooling 虽然解决的cnn网络在单张完整图重复计算的问题(每个由ss算法得到的区域候 阅读全文
posted @ 2017-10-21 22:13 仙守 阅读(483) 评论(0) 推荐(0) 编辑
摘要: 近些年,随着DL的不断兴起,计算机视觉中的对象检测领域也随着CNN的广泛使用而大放异彩,其中Girshick等人的《R-CNN》是第一篇基于CNN进行对象检测的文献。本文欲通过自己的理解来记录这几大模型的发展。(自己挖坑,自己待填) ###0. overfeat ###0.1. MultiBox # 阅读全文
posted @ 2017-10-17 10:29 仙守 阅读(590) 评论(0) 推荐(0) 编辑
摘要: 非极大抑制,是在对象检测中用的较为频繁的方法,当在一个对象区域,框出了很多框,那么如下图: 上图来自这里 目的就是为了在这些框中找到最适合的那个框.有以下几种方式: 1 nms 2 soft-nms 3 softer-nms 1. nms 主要就是通过迭代的形式,不断的以最大得分的框去与其他框做io 阅读全文
posted @ 2017-08-23 10:30 仙守 阅读(1585) 评论(0) 推荐(0) 编辑
摘要: 接着扯YOLO v2 相比较于YOLO v1,作者在之前模型上,先修修补补了一番,提出了YOLO v2模型。并基于imagenet的分类数据集和coco的对象检测数据集,提出了wordnet模型,并成功的提出了YOLO9000模型。这里暂时只讲YOLO v2. 作者说yolo v1相比较其他基于区域 阅读全文
posted @ 2017-08-22 18:52 仙守 阅读(2931) 评论(0) 推荐(0) 编辑
摘要: 这部分,我们来聊聊YOLO. YOLO:You Only Look Once,顾名思义,就是希望网络在训练过程中,一张图片只要看一次就行,不需要去多次观察,比如滑框啥的,从而从底层原理上就减少了很多的计算量。 ###0 - 扯扯 图1.YOLOv1检测过程 上图为YOLOv1的检测过程(其实第二版在 阅读全文
posted @ 2017-08-22 14:46 仙守 阅读(838) 评论(0) 推荐(0) 编辑
摘要: 最近需要做图片中文本识别的项目,然后为了快速验证模型,所以找到了mscoco-text数据集,网站1上是这么说的: 官网是这么说的: 然而,我下下来之后: 1 - 先导入: 2 - 其中key为’imgToAnns’是图片序号对应的注释序号,却是这样的: 然后,其中具体的图片中文字并不是完全标记出来 阅读全文
posted @ 2017-06-14 22:00 仙守 阅读(497) 评论(0) 推荐(0) 编辑
上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 25 下一页