随笔分类 - CNN(卷积神经网络)
摘要:TensorRT是Nvidia开发的一个高性能深度学习推理引擎。 它主要用于优化和部署已经训练好的深度学习模型, 提高模型在NVIDIA GPU硬件上的推理性能。 TensorRT的主要功能和特点包括: 1. 模型优化 TensorRT提供了一系列优化技术, 包括层融合, 张量格式化, kernel
阅读全文
摘要:paper:Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks Tensorflow-faster r-cnn github:Tensorflow Faster RCNN for Object
阅读全文
摘要:RCNN存在的问题: 1、一张图像上有大量的重叠框,所以这些候选框送入神经网络时候,提取特征会有冗余! 2、训练的空间需求大。因为RCNN中,独立的分类器和回归器需要很多的特征作为训练。RCNN中提取候选框,提取特征和分类回归是分开的,可独立。 Fast RCNN 针对上诉问题: Q1:将整张图片归
阅读全文
摘要:目标检测architecture通常可以分为两个阶段: (1)region proposal:给定一张输入image找出objects可能存在的所有位置。这一阶段的输出应该是一系列object可能位置的bounding box。这些通常称之为region proposals或者 regions of
阅读全文
摘要:SPP-Net是出自2015年发表在IEEE上的论文-《Spatial Pyramid Pooling in Deep ConvolutionalNetworks for Visual Recognition》。在此之前,所有的神经网络都是需要输入固定尺寸的图片,比如224*224(ImageNet
阅读全文
摘要:基于region proposal的RCNN系列:RCNN、Fast RCNN、Faster RCNN 基于区域划分的YOLO、SSD 基于强化学习的AttentionNet等,还有最新的Mask RCNN。 我们将用一周时间先详细介绍每个模型然后通过Tensorflow跑一遍模型。 说到基于reg
阅读全文
摘要:先介绍几个物体检测的相关知识 不同于分类问题,物体检测可能会存在多个检测目标,这不仅需要我们判别出各个物体的类别,而且还要准确定位出物体的位置 下面图片上有猫,有狗,还有小黄鸭,这是多物体检测: 1.png 物体检测算法常用到的概念 下面我们讲解一下在物体检测算法中常用到的几个概念:Bbox,IoU
阅读全文
摘要:用3D卷积做视频特征提取,这样时间和空间信息就都包含在内了。 3D卷积+RNN时间序列 应该是对视频处理的一个较好解决方案。
阅读全文
摘要:如何以图学图 用图片做标签
阅读全文
摘要:“Xavier”初始化方法是一种很有效的神经网络初始化方法,方法来源于2010年的一篇论文《Understanding the difficulty of training deep feedforward neural networks》,可惜直到近两年,这个方法才逐渐得到更多人的应用和认可。 为
阅读全文
摘要:TensorBoard是TensorFlow下的一个可视化的工具,能够帮助我们在训练大规模神经网络过程中出现的复杂且不好理解的运算。 TensorBoard能展示你训练过程中绘制的图像、网络结构等。 1.构建简单的TensorBoard日志输出 import tensorflow as tf inp
阅读全文
摘要:模型文件的保存 tensorflow将模型保持到本地会生成4个文件: meta文件:保存了网络的图结构,包含变量、op、集合等信息 ckpt文件: 二进制文件,保存了网络中所有权重、偏置等变量数值,分为两个文件,一个是.data-00000-of-00001 文件,一个是 .index 文件 che
阅读全文
摘要:TFRecord生成 一、为什么使用TFRecord? 正常情况下我们训练文件夹经常会生成 train, test 或者val文件夹,这些文件夹内部往往会存着成千上万的图片或文本等文件,这些文件被散列存着,这样不仅占用磁盘空间,并且再被一个个读取的时候会非常慢,繁琐。占用大量内存空间(有的大型数据不
阅读全文
摘要:应用场景 假如我们有一系列诉求是把图片识别成一个特定分类、比如 把图片分类成为猫、狗、狼等 把图片分类成为奔驰、宝马、奥迪 ... 几乎很少有人从头训练网络、复用只有训练的网络参数适应新的数据集、参考transfer-learning In practice, very few people tra
阅读全文
摘要:LeNet-5、AlexNet、ZFNet、VGGNet、GoogleNet、ResNet,ResNeXt,DenseNet,Shake Shake,SeNet,MobileNet,ShuffleNet,DarkNet LeNet:最早用于数字识别的CNN AlexNet:2012年ILSVRC比赛
阅读全文
摘要:整个优化系列文章列表: Deep Learning 之 最优化方法 Deep Learning 最优化方法之SGD Deep Learning 最优化方法之Momentum(动量) Deep Learning 最优化方法之Nesterov(牛顿动量) Deep Learning 最优化方法之AdaG
阅读全文
摘要:批归一化方法方法(Batch Normalization,BatchNorm)是由Ioffe和Szegedy于2015年提出的,已被广泛应用在深度学习中,其目的是对神经网络中间层的输出进行标准化处理,使得中间层的输出更加稳定。 通常我们会对神经网络的数据进行标准化处理,处理后的样本数据集满足均值为0
阅读全文
摘要:一、卷积(Convolution) 那么究竟什么是卷积呢?你可能还记得我之前的博客,我们使用了一个小的滤波器(Filter),并在整个图像上滑动这个滤波器。然后,将图像的像素值与滤波器中的像素值相乘。使用深度学习的优雅之处在于我们不必考虑这些滤波器应该是什么样的(神经网络会自动学习并选取最佳的滤波器
阅读全文