随笔分类 -  机器视觉-深度学习模型

摘要:本博客参考作者链接:https://zhuanlan.zhihu.com/p/41423739 前言: VGG是Oxford的Visual Geometry Group的组提出的(大家应该能看出VGG名字的由来了)。该网络是在ILSVRC 2014上的相关工作,主要工作是证明了增加网络的深度能够在一 阅读全文
posted @ 2019-04-16 10:51 U_C 阅读(1933) 评论(0) 推荐(0) 编辑
摘要:YOLO 在卷积层之后使用了 DarkNet 来做特征检测。 然而,它并没有使用多尺度特征图来做独立的检测。相反,它将特征图部分平滑化,并将其和另一个较低分辨率的特征图拼接。例如,YOLO 将一个 28 × 28 × 512 的层重塑为 14 × 14 × 2048,然后将它和 14 × 14 ×1 阅读全文
posted @ 2018-05-22 14:52 U_C 阅读(694) 评论(0) 推荐(0) 编辑
摘要:SSD 是使用 VGG19 网络作为特征提取器(和 Faster R-CNN 中使用的 CNN 一样)的单次检测器。我们在该网络之后添加自定义卷积层(蓝色),并使用卷积核(绿色)执行预测。 同时对类别和位置执行单次预测。 然而,卷积层降低了空间维度和分辨率。因此上述模型仅可以检测较大的目标。为了解决 阅读全文
posted @ 2018-05-22 14:42 U_C 阅读(481) 评论(0) 推荐(0) 编辑
摘要:在 Faster R-CNN 中,检测器使用了多个全连接层进行预测。如果有 2000 个 ROI,那么成本非常高。 R-FCN 通过减少每个 ROI 所需的工作量实现加速。上面基于区域的特征图与 ROI 是独立的,可以在每个 ROI 之外单独计算。剩下的工作就比较简单了,因此 R-FCN 的速度比 阅读全文
posted @ 2018-05-22 14:29 U_C 阅读(1559) 评论(0) 推荐(0) 编辑
摘要:使用候选区域方法(region proposal method)创建目标检测的感兴趣区域(ROI)。在选择性搜索(selective search,SS)中,首先将每个像素作为一组。然后,计算每一组的纹理,并将两个最接近的组结合起来。但是为了避免单个区域吞噬其他区域,首先对较小的组进行分组。继续合并 阅读全文
posted @ 2018-05-22 14:19 U_C 阅读(998) 评论(0) 推荐(0) 编辑
摘要:1X1卷积层的作用: 1.实现跨通道的交互和信息整合.2.进行卷积核通道数的降维和升维.3.就是可以在保持feature map 尺寸不变(即不损失分辨率)的前提下大幅增加非线性特性,把网络做得很deep. 参考网址: https://www.zhihu.com/question/56024942 阅读全文
posted @ 2018-05-22 13:43 U_C 阅读(1504) 评论(0) 推荐(0) 编辑
摘要:1、应用场景及常用网络结构 目标检测:R-CNN系列、YOLO系列、SSD系列、RFCN 场景图像分割:FCN、U-NET、Segnet 实例分割:MASK-RCNN 2、平台 Tensorflow \Caffe\Pytorch 3、分析工具 python及相应的依赖库 numpy pandas m 阅读全文
posted @ 2018-05-22 11:54 U_C 阅读(1506) 评论(0) 推荐(0) 编辑
摘要:1、kitti数据集(参考博客:https://blog.csdn.net/jesse_mx/article/details/65634482 https://blog.csdn.net/baolinq/article/details/78939192)(1)下载数据集和标签,下载第1个图片集 Do 阅读全文
posted @ 2018-05-15 09:03 U_C 阅读(1688) 评论(0) 推荐(0) 编辑
摘要:1、【yolov1】 第一步:将图像划分为S*S的栅格(grid cell),这里分成了7*7的grid cell。栅格的任务是:检测中心落在该栅格中的物体(注意,栅格中心未必与物体的中心重合,这个一定要明确,对后面的理解才不会产生影响)。 第二步:一个grid cell 可以预测B个boundin 阅读全文
posted @ 2018-05-14 19:06 U_C 阅读(1460) 评论(0) 推荐(1) 编辑

点击右上角即可分享
微信分享提示