随笔分类 - deep-learning
PointNet原理详解
摘要:@ 一、3D点云的挑战 以无序点云作为输入,因此模型需要具备排序不变性 点云的旋转,平移不应该改变点云的类别,因此模型需要具备几何变换不变性 二、排序不变性 排序不变性,即输入的点云的顺序不应该改变点云所代表的物体类别 当一个 在 N的维度上随意的打乱之后,其表述的应该是同一
阅读全文
目标检测算法RCNN,Fast RCNN,Faster RCNN
摘要:@ 一、REGION CNN 1.1 原理 滑窗法是一种行之有效的暴力方法,先生成大量的候选框,对每个框进行分类,可以大概的检测出类 一张图像生成1K~2K个候选区域 对每个候选区域,使用深度网络提取特征 特征送入每一类的SVM分类器,判别是否属于该类 使用回归器精细修正候选框位置 1.2 候选区域
阅读全文
变形卷积
摘要:@ 一、传统CNN结构存在的问题 结构固定 无法考虑不同区域不同形变的影响 计算并非最优化 不同任务对卷积的计算有不同的偏好 二、变形卷积 2.1 带孔卷积 Dialted Conv, 用同样的卷积核大小获取更大的感受野 2.2 可变形卷积 Deformable Conv 卷积核不再是矩形 优点 解
阅读全文
从源码安装tensorflow1.8-gpu版本
摘要:https://blog.csdn.net/lengji22/article/details/86309649
阅读全文
安装TensorRT
摘要:下载对应的tar版本:https://developer.nvidia.com/nvidia-tensorrt-6x-download 解压安装包 version="6.0.1.8" os="Ubuntu-16.04" arch=$(uname -m) cuda="cuda-10.2" cudnn=
阅读全文
目标检测模型评价指标IoU、mAP
摘要:@ 一、IOU 交并比loU(intersection-over-union) 二、mAP 2.1 简介 mAP(mean average precision)平均准确率均值 2.2 计算方法 多标签图像分类任务中图片的标签不止一个,因此评价不能用普通单标签图像分类的标准。首先用训练好的模型得到所有
阅读全文
生成对抗网络--Generative Adversarial Networks (GAN)
摘要:@ 一、简介 ●lan Goodfellow 2014年提出 ●非监督式学习任务 ●使用两个深度神经网络: Generator (生成器), Discriminator(判别器) 二、原理 举一个制造假钞的例子: 生成器:制造假钞的人 判别器:警察 训练过程: 制造假钞的人生产假钞 警察判断是否是假
阅读全文
语义分割(semantic segmentation)——U-Net
摘要:一、定义 语义图像分割的目标是标记图像每个像素的类别。因为我们需要预测图像中的每个像素,所以此任务通常被称为密集预测。 二、参考资料 论文:U-Net: Convolutional Networks for Biomedical Image Segmentation 三、网络结构 四、Transpo
阅读全文
目标检测SSD: Single Shot MultiBox Detector
摘要:一、前言 1.1 什么是目标检测 目标检测问题可以分为以下两个问题: 分类:所有类别的概率 定位: 4个值(中心位置x,y,宽w,高h) 目标检测近年来已经取得了很重要的进展,主流的算法主要分为两个类型(参考RefineDet):(1)two-stage方法,如R-CNN系算法,其主要思路是先通过启
阅读全文
基于内容的图像检索(CBIR) ——以图搜图
摘要:@[TOC] 在CBIR中,图像通过其视觉内容(例如颜色,纹理,形状)来索引。 一、实现原理 首先从图像数据库中提取特征并存储它。然后我们计算与查询图像相关的特征。最后,我们检索具有最近特征的图像 二、 基于内容的图像检索的特征提取 在这篇研究论文中(https://arxiv.org/pdf/14
阅读全文
去噪自动编码器
摘要:降噪自动编码器是一种用于图像去噪无监督的反馈神经网络 原理如下图所示 训练代码如下 python from keras.layers import Input, Conv2D, MaxPooling2D, UpSampling2D, ZeroPadding2D from keras.models i
阅读全文
深度残差网络(Deep residual network, ResNet)
摘要:@[TOC] 一、前言 深度残差网络(Deep residual network, ResNet)的提出是CNN图像史上的一件里程碑事件,让我们先看一下ResNet在ILSVRC和COCO 2015上的战绩: ResNet取得了5项第一,并又一次刷新了CNN模型在ImageNet上的历史, Imag
阅读全文
欠拟合(Under fitting)和过拟合 (Overfitting)
摘要:[TOC] 一、定义 在训练数据集上的准确率很⾼,但是在测试集上的准确率⽐较低 二、理解bias和variance :简单来说训练出来的模型在训练集上的准确度。 :就是模型在不同训练集上的效果差别很大。方差越大的模型越容易过拟合。假设有两个训练集A和B,经过A训练的模型Fa与经过B训练的模型Fb差异
阅读全文
图像理解(Image Captioning)(2)文本处理和模型
摘要:@ "TOC" 一、文本处理 1.1 生成图像的描述文件 根据数据集中的 文件生成含有图片对应的描述的文件 2.2 单词嵌⼊(Word Embedding) LSTM的输⼊是数值, 单词需要转换为数值才能使⽤LSTM, 最简单的⽅式是将单词转化为整数,每个单词都对应于⼀个整数. 但是这样的⽅式⽆法有
阅读全文
图像理解(Image Captioning)(1)CNN部分
摘要:[TOC] 一、 应用领域 图像搜索 安全监控 鉴黄 二、 原理 CNN(卷积神经⽹络) 1. 图像特征提取 2. 迁移学习(transfer learning) LSTM(递归神经⽹络 ) 3. ⽂字串(sequence)的特征提取 DNN(深度神经⽹络) 5. 从图像特征和⽂字串(sequenc
阅读全文
解决Anaconda和Ros的python和opencv等的版本冲突问题
摘要:安装 ros 后,Anaconda envs 环境 import cv2 出错 在 中写入 之后,默认会把 路径加入到 环境变量中 删除 anaconda envs 环境变量中的 ros 相关路径 注:此方法单次有效,即每次执行 import cv2之前,都要先执行此操作 若想长期有效只需注释掉 ~
阅读全文