摘要: 一、数学先验知识: 二、激活函数推导 a)、Relu b)、Leaky Relu Leaky ReLU只是对ReLU的x负半轴部分添加一个很小的斜率,规避神经元死完这个问题 c)、ELU 用公式(1-1)中e^x-1代替Leaky Relu 中x<0时的x,则有 d)、其他激活函数[1] 对这个式子 阅读全文
posted @ 2021-01-08 21:28 勇者归来 阅读(532) 评论(0) 推荐(0) 编辑
摘要: 下面会介绍基于ResNet50的Mask RCNN网络,其中会涉及到RPN、FPN、ROIAlign以及分类、回归使用的损失函数等 介绍时所采用的MaskRCNN源码(python版本)来源于GitHub:https://github.com/matterport/Mask_RCNN 下面的介绍都是 阅读全文
posted @ 2019-04-07 16:07 勇者归来 阅读(24796) 评论(6) 推荐(6) 编辑
摘要: 利用sklearn.dataset随机产生数据,随机生成两类数据,用不同的颜色展示出来,如下图: 产生的随机代码如下: 一、线性分类 先使用sklearn自带的线性分类方法,将上面的数据分为两类,代码和效果图如下: 二、神经网络分类 定义如下图所示的神经网络: 网络结构:输入层、隐藏层、输出层【2, 阅读全文
posted @ 2018-10-07 16:39 勇者归来 阅读(2188) 评论(0) 推荐(0) 编辑
摘要: 假设有如上图所示的神经网络实例图 网络描述如下: 1)有2个输入,即图中的x1、x2 2)有3个神经元,即途中的b1、b2、b3 3)共2层网络。第1层的神经元是b1、b2,第2层的神经元是b3.可将中间层称为隐层。例如途中的b1、b2就属于隐层 4)有6个权重(w11到w23)。最终输出为OUT。 阅读全文
posted @ 2018-10-03 17:52 勇者归来 阅读(2048) 评论(0) 推荐(1) 编辑
摘要: 首先,先回顾梯度下降公式:(下面利用均方差MSE损失来进行演示) 梯度下降的训练公式: 接下来,按照上面的公式进行求最大值的案例讲解 令,学习速率为0.1,初始化参数w1=0,w2=0,b=0 样本一:x1=0.1,x2=0.8 输出: OUT=w1x1 + w2x2 + b =0*0.1 + 0* 阅读全文
posted @ 2018-10-03 17:01 勇者归来 阅读(4132) 评论(0) 推荐(2) 编辑
摘要: 涉及到的知识点补充: FasterRCNN:https://www.cnblogs.com/wangyong/p/8513563.html RoIPooling、RoIAlign:https://www.cnblogs.com/wangyong/p/8523814.html FPN:https:// 阅读全文
posted @ 2018-07-14 18:31 勇者归来 阅读(72696) 评论(21) 推荐(5) 编辑
摘要: 制作环境:Andconda3,python3.6 一、安装pyInstaller 方式一): 在命令行输入:pip install pyinstaller 方式二): ① 下载pyInstaller源代码进行安装 打开网址:http://www.pyinstaller.org/downloads.h 阅读全文
posted @ 2018-06-13 17:45 勇者归来 阅读(5968) 评论(0) 推荐(0) 编辑
摘要: 论文地址: http://openaccess.thecvf.com/content_cvpr_2017/papers/Hu_FC4_Fully_Convolutional_CVPR_2017_paper.pdf 源代码(Python): https://github.com/yuanming-hu 阅读全文
posted @ 2018-06-05 17:59 勇者归来 阅读(9186) 评论(0) 推荐(0) 编辑
摘要: 一、灰度世界算法 ① 算法原理 灰度世界算法以灰度世界假设为基础,该假设认为:对于一幅有着大量色彩变化的图像,R,G,B三个分量的平均值趋于同一灰度值Gray。从物理意义上讲,灰色世界法假设自然界景物对于光线的平均反射的均值在总体上是个定值,这个定值近似地为“灰色”。颜色平衡算法将这一假设强制应用于 阅读全文
posted @ 2018-05-31 22:32 勇者归来 阅读(27606) 评论(7) 推荐(0) 编辑
摘要: SILC算法详解 一、原理介绍 SLIC算法是simple linear iterative cluster的简称,该算法用来生成超像素(superpixel) 算法步骤: 已知一副图像大小M*N,可以从RGB空间转换为LAB空间,LAB颜色空间表现的颜色更全面 假如预定义参数K,K为预生成的超像素 阅读全文
posted @ 2018-05-04 16:54 勇者归来 阅读(27022) 评论(6) 推荐(2) 编辑
摘要: 视网膜-大脑皮层(Retinex)理论认为世界是无色的,人眼看到的世界是光与物质相互作用的结果,也就是说,映射到人眼中的图像和光的长波(R)、中波(G)、短波(B)以及物体的反射性质有关 其中I是人眼中看到的图像,R是物体的反射分量,L是环境光照射分量,(x, y)是二维图像对应的位置 基于上面的原 阅读全文
posted @ 2018-03-28 18:10 勇者归来 阅读(8820) 评论(11) 推荐(0) 编辑
摘要: 一、准备数据集 1) 下载数据集 Imagnet网站上下载了三类图片,分别是big cat、dog、fish,其中训练集的图片数一共是4149,测试集的图片数是1003,训练集和测试集的图片数比例4:1,将训练集的图片保存在train文件夹下,测试集图片保存在val文件夹下. train、val文件 阅读全文
posted @ 2018-03-21 14:45 勇者归来 阅读(8185) 评论(0) 推荐(0) 编辑
摘要: 通常,利用网络对物体进行检测时,浅层网络分辨率高,学到的是图片的细节特征,深层网络,分辨率低,学到的更多的是语义特征。 1)、通常的CNN使用如下图中显示的网络,使用最后一层特征图进行预测 例如VGG16,feat_stride=16,表示若原图大小是1000*600,经过网络后最深一层的特征图大小 阅读全文
posted @ 2018-03-09 17:26 勇者归来 阅读(14283) 评论(8) 推荐(5) 编辑
摘要: 一)、RoIPooling 这个可以在Faster RCNN中使用以便使生成的候选框region proposal映射产生固定大小的feature map 先贴出一张图,接着通过这图解释RoiPooling的工作原理 针对上图 1)Conv layers使用的是VGG16,feat_stride=3 阅读全文
posted @ 2018-03-07 17:34 勇者归来 阅读(54906) 评论(21) 推荐(16) 编辑
摘要: 下面的介绍都是基于VGG16 的Faster RCNN网络,各网络的差异在于Conv layers层提取特征时有细微差异,至于后续的RPN层、Pooling层及全连接的分类和目标定位基本相同. 一)、整体框架 我们先整体的介绍下上图中各层主要的功能 1)、Conv layers提取特征图: 作为一种 阅读全文
posted @ 2018-03-06 11:45 勇者归来 阅读(117414) 评论(49) 推荐(31) 编辑