2019 年 7月随笔档案 - 黎明程序员

深度学习面试题29：GoogLeNet(Inception V3)

摘要：目录使用非对称卷积分解大filters 重新设计pooling层辅助构造器使用标签平滑参考资料在《深度学习面试题20：GoogLeNet(Inception V1)》和《深度学习面试题26：GoogLeNet(Inception V2)》中对前两个Inception版本做了介绍，下面主要阐阅读全文

posted @ 2019-07-28 14:46 黎明程序员阅读(465) 评论(0) 推荐(0) 编辑

深度学习面试题28：标签平滑(Label smoothing)

摘要：目录产生背景工作原理参考资料产生背景假设选用softmax交叉熵训练一个三分类模型，某样本经过网络最后一层的输出为向量x=(1.0, 5.0, 4.0)，对x进行softmax转换输出为：假设该样本y=[0, 1, 0]，那损失loss: 按softmax交叉熵优化时，针对这个样本而言，阅读全文

posted @ 2019-07-27 11:48 黎明程序员阅读(8347) 评论(0) 推荐(0) 编辑

深度学习面试题27：非对称卷积(Asymmetric Convolutions)

摘要：目录产生背景举例参考资料产生背景之前在深度学习面试题16：小卷积核级联卷积VS大卷积核卷积中介绍过小卷积核的三个优势： ①整合了三个非线性激活层，代替单一非线性激活层，增加了判别能力。 ②减少了网络参数。 ③减少了计算量在《Rethinking the Inception Archite 阅读全文

posted @ 2019-07-26 18:13 黎明程序员阅读(4097) 评论(0) 推荐(1) 编辑

深度学习面试题26：GoogLeNet(Inception V2)

摘要：目录第一层卷积换为分离卷积一些层的卷积核的个数发生了变化多个小卷积核代替大卷积核一些最大值池化换为了平均值池化完整代码参考资料第一层卷积换为分离卷积 net = slim.separable_conv2d( inputs, depth(64), [7, 7], depth_multip 阅读全文

posted @ 2019-07-26 17:03 黎明程序员阅读(651) 评论(0) 推荐(0) 编辑

深度学习面试题25：分离卷积(separable卷积)

摘要：目录举例单个张量与多个卷积核的分离卷积参考资料举例分离卷积就是先在深度上分别卷积，然后再进行卷积，对应代码为： import tensorflow as tf # [batch, in_height, in_width, in_channels] input =tf.reshape(tf. 阅读全文

posted @ 2019-07-26 15:51 黎明程序员阅读(729) 评论(0) 推荐(0) 编辑

深度学习面试题24：在每个深度上分别卷积(depthwise卷积)

摘要：目录举例单个张量与多个卷积核在深度上分别卷积参考资料举例如下张量x和卷积核K进行depthwise_conv2d卷积结果为： depthwise_conv2d和conv2d的不同之处在于conv2d在每一深度上卷积，然后求和，depthwise_conv2d没有求和这一步，对应代码为：阅读全文

posted @ 2019-07-26 14:59 黎明程序员阅读(2072) 评论(1) 推荐(1) 编辑

深度学习面试题23：批次张量和卷积核的简易定义方式

摘要：目录直接定义的缺点简易定义的方式参考资料直接定义的缺点在tensorflow中假设有一批输入为：其定义如下： tf.constant([ [ [ [3, 1, -3], [1, -1, 7] ], [ [-2, 2, -5], [2, 7, 3] ] ], [ [ [-1, 3, 1], 阅读全文

posted @ 2019-07-26 14:17 黎明程序员阅读(765) 评论(0) 推荐(0) 编辑

深度学习面试题22：批量归一化在实践中的应用

摘要：目录指数移动平均 BN在卷积网络中的使用参考资料假设已经训练好一个带有BN操作的卷积神经网络，但是在使用它预测时，往往每次只输入一个样本，那么经过该网络时，计算平均值和方差的意义就不大了，常采用的策略是计算训练阶段的平均值和方差的指数移动平均，然后在预测阶段使用它们作为BN操作时的平均值和方差阅读全文

posted @ 2019-07-25 11:25 黎明程序员阅读(701) 评论(0) 推荐(0) 编辑

深度学习面试题21：批量归一化(Batch Normalization,BN)

摘要：目录 BN的由来 BN的作用 BN的操作阶段 BN的操作流程 BN可以防止梯度消失吗为什么归一化后还要放缩和平移 BN在GoogLeNet中的应用参考资料 BN的由来 BN是由Google于2015年提出，论文是《Batch Normalization_ Accelerating Deep Ne 阅读全文

posted @ 2019-07-24 22:13 黎明程序员阅读(7057) 评论(0) 推荐(2) 编辑

深度学习面试题20：GoogLeNet(Inception V1)

摘要：目录简介网络结构对应代码网络说明参考资料简介 2014年，GoogLeNet和VGG是当年ImageNet挑战赛(ILSVRC14)的双雄，GoogLeNet获得了第一名、VGG获得了第二名，这两类模型结构的共同特点是层次更深了。VGG继承了LeNet以及AlexNet的一些框架结构，而阅读全文

posted @ 2019-07-23 10:51 黎明程序员阅读(1495) 评论(0) 推荐(1) 编辑

深度学习面试题19：1*1卷积核的作用

摘要：目录举例在Inception module上的应用参考资料可以减少计算量，可以增加非线性判别能力举例假设有1个高为30、宽为40，深度为200的三维张量与55个高为5、宽为5、深度为200的卷积核same卷积，步长=1，则结果是高为30、宽为40、深度为55的三维张量，如图所示：该卷积阅读全文

posted @ 2019-07-22 11:52 黎明程序员阅读(1396) 评论(0) 推荐(0) 编辑

深度学习面试题18：网中网结构(Network in Network)

摘要：目录举例参考资料网中网结构通过多个分支的运算（卷积或池化），将分支上的运算结果在深度上连接举例一个3*3*2的张量，与3个1*1*2的卷积核分别same卷积，步长=1，与2个2*2*2的卷积核分别same卷积，步长=1，与1个3*3*2的掩码最大值same池化，步长=1，将得到的这阅读全文

posted @ 2019-07-21 23:31 黎明程序员阅读(761) 评论(0) 推荐(0) 编辑

深度学习面试题17：VGGNet(1000类图像分类)

摘要：目录 VGGNet网络结构论文中还讨论了其他结构参考资料 2014年，牛津大学计算机视觉组（Visual Geometry Group）和Google DeepMind公司的研究员一起研发出了新的深度卷积神经网络：VGGNet，并取得了ILSVRC2014比赛分类项目的第二名（第一名是GoogL 阅读全文

posted @ 2019-07-20 11:44 黎明程序员阅读(2245) 评论(0) 推荐(1) 编辑

深度学习面试题16：小卷积核级联卷积VS大卷积核卷积

摘要：目录感受野多个小卷积核连续卷积和单个大卷积核卷积的作用相同小卷积核的优势参考资料感受野在卷积神经网络中，感受野（Receptive Field）的定义是卷积神经网络每一层输出的特征图（feature map）上的像素点在输入图片上映射的区域大小。再通俗点的解释是，特征图上的一个点对应输入阅读全文

posted @ 2019-07-19 17:48 黎明程序员阅读(6076) 评论(0) 推荐(1) 编辑

深度学习面试题15：卷积核需要旋转180度

摘要：目录举例结论参考资料在一些书籍和博客中所讲的卷积（一个卷积核和输入的对应位置相乘，然后累加）不是真正意义上的卷积。根据离散卷积的定义，卷积核是需要旋转180的。按照定义来说，一个输入和一个卷积核做卷积操作的流程是： ①卷积核旋转180 ②对应位置相乘，然后累加举例下面这个图是常见的卷积阅读全文

posted @ 2019-07-19 11:30 黎明程序员阅读(3001) 评论(0) 推荐(0) 编辑

深度学习面试题14：Dropout(随机失活)

摘要：目录卷积层的dropout 全连接层的dropout Dropout的反向传播 Dropout的反向传播举例参考资料在训练过程中，Dropout会让输出中的每个值以概率keep_prob变为原来的1/keep_prob倍，以概率1-keep_prob变为0。也就是在每一轮的训练中让一些神经元随阅读全文

posted @ 2019-07-17 20:51 黎明程序员阅读(1297) 评论(0) 推荐(1) 编辑

深度学习面试题13：AlexNet(1000类图像分类)

摘要：目录网络结构两大创新点参考资料第一个典型的CNN是LeNet5网络结构，但是第一个引起大家注意的网络却是AlexNet，Alex Krizhevsky其实是Hinton的学生，这个团队领导者是Hinton，于2012年发表论文。 AlexNet有60 million个参数和65000个神经阅读全文

posted @ 2019-07-16 20:18 黎明程序员阅读(1749) 评论(0) 推荐(2) 编辑

深度学习面试题12：LeNet(手写数字识别)

摘要：目录神经网络的卷积、池化、拉伸 LeNet网络结构 LeNet在MNIST数据集上应用参考资料 LeNet是卷积神经网络的祖师爷LeCun在1998年提出，用于解决手写数字识别的视觉任务。自那时起，CNN的最基本的架构就定下来了：卷积层、池化层、全连接层。如今各大深度学习框架中所使用的LeNet 阅读全文

posted @ 2019-07-15 19:40 黎明程序员阅读(1269) 评论(0) 推荐(0) 编辑

深度学习面试题11：池化（same池化、valid池化、带深度的池化）

摘要：目录 Same最大值池化多深度的same池化 Same平均值池化 Valid池化参考资料池化(Pooling)操作与卷积类似，取输入张量的每个位置的矩形领域内的最大值或平均值作为该位置的输出。池化操作分为same池化和valid池化，同时还可以设置移动的步长 Same最大值池化举例：4行4 阅读全文

posted @ 2019-07-13 11:39 黎明程序员阅读(1758) 评论(0) 推荐(0) 编辑

深度学习面试题10：二维卷积（Full卷积、Same卷积、Valid卷积、带深度的二维卷积）

摘要：目录二维Full卷积二维Same卷积二维Valid卷积三种卷积类型的关系具备深度的二维卷积具备深度的张量与多个卷积核的卷积参考资料二维卷积的原理和一维卷积类似，也有full卷积、same卷积和valid卷积。举例：3*3的二维张量x和2*2的二维张量K进行卷积二维Full卷积 F 阅读全文

posted @ 2019-07-13 09:29 黎明程序员阅读(7060) 评论(0) 推荐(0) 编辑

深度学习面试题09：一维卷积（Full卷积、Same卷积、Valid卷积、带深度的一维卷积）

摘要：目录一维Full卷积一维Same卷积一维Valid卷积三种卷积类型的关系具备深度的一维卷积具备深度的张量与多个卷积核的卷积参考资料一维卷积通常有三种类型：full卷积、same卷积和valid卷积，下面以一个长度为5的一维张量I和长度为3的一维张量K（卷积核）为例，介绍这三种卷积的计阅读全文

posted @ 2019-07-12 17:46 黎明程序员阅读(22381) 评论(3) 推荐(5) 编辑

深度学习面试题08：梯度消失与梯度爆炸

摘要：目录梯度消失梯度爆炸参考资料以下图的全连接神经网络为例，来演示梯度爆炸和梯度消失：梯度消失在模型参数w都是(-1,1)之间的数的前提下，如果激活函数选择的是sigmod(x)，那么他的导函数σ’(x)的值域为(0,0.25]，即如下三项的范围都是(0,0.25] 那么w1的导数会有很多( 阅读全文

posted @ 2019-07-08 20:37 黎明程序员阅读(1925) 评论(0) 推荐(0) 编辑

深度学习面试题07：sigmod交叉熵、softmax交叉熵

摘要：目录 sigmod交叉熵 Softmax转换 Softmax交叉熵参考资料 sigmod交叉熵 Sigmod交叉熵实际就是我们所说的对数损失，它是针对二分类任务的损失函数，在神经网络中，一般输出层只有一个结点。假设y为样本标签，_y为全连接网络的输出层的值，那么，这个对数损失定义为 PS：这个是阅读全文

posted @ 2019-07-08 19:12 黎明程序员阅读(1804) 评论(0) 推荐(0) 编辑

深度学习面试题06：全连接神经网络正向传播与梯度反向传播

摘要：目录链式法则逻辑回归的正、反向传播逻辑回归的正、反向传播案例全连接神经网络的正、反向传播全连接神经网络的正、反向传播案例参考资料链式法则类型一：类型二：类型三：返回目录逻辑回归的正、反向传播逻辑回归可以看做最简单的神经网络，他只有一个神经元，损失函数选择的是对数损失，他的正阅读全文

posted @ 2019-07-07 23:01 黎明程序员阅读(2308) 评论(0) 推荐(0) 编辑

深度学习面试题05：激活函数sigmod、tanh、ReLU、LeakyRelu、Relu6

摘要：目录为什么要用激活函数 sigmod tanh ReLU LeakyReLU ReLU6 参考资料为什么要用激活函数在神经网络中，如果不对上一层结点的输出做非线性转换的话，再深的网络也是线性模型，只能把输入线性组合再输出（如下图），不能学习到复杂的映射关系，因此需要使用激活函数这个非线性函数做阅读全文

posted @ 2019-07-04 14:58 黎明程序员阅读(18374) 评论(0) 推荐(1) 编辑

深度学习面试题04：随机梯度下降法、批量梯度下降法、小批量梯度下降

摘要：目录一元线性回归模型一元线性回归代价函数图像梯度下降求解 SGD、BGD、Mini-batchGD的特点参考资料在《深度学习面试题03改进版梯度下降法Adagrad、RMSprop、Momentum、Adam》中讲到了多种改进的梯度下降公式。而这篇文章和03篇描述的不是一个事情，我们从一个阅读全文

posted @ 2019-07-03 23:36 黎明程序员阅读(4088) 评论(3) 推荐(1) 编辑

深度学习面试题03：改进版梯度下降法Adagrad、RMSprop、Momentum、Adam

摘要：目录 Adagrad法 RMSprop法 Momentum法 Adam法参考资料发展历史标准梯度下降法的缺陷如果学习率选的不恰当会出现以上情况因此有一些自动调学习率的方法。一般来说，随着迭代次数的增加，学习率应该越来越小，因为迭代次数增加后，得到的解应该比较靠近最优解，所以要缩小步长η，那阅读全文

posted @ 2019-07-03 13:57 黎明程序员阅读(4431) 评论(3) 推荐(1) 编辑

深度学习面试题02：标准梯度下降法

摘要：目录一元函数的梯度下降法多元函数的梯度下降法参考资料梯度下降是一种迭代式的最优化手段，在机器学习中一般用于求目标函数的极小值点，这个极小值点就是最优的模型内部参数。相比求解析解的手段，GD的通用性更强，所以受到广泛的使用。一元函数的梯度下降法比如求解f(x)=(x-1)2的最小值点梯度阅读全文

posted @ 2019-07-02 10:08 黎明程序员阅读(1441) 评论(0) 推荐(0) 编辑

深度学习面试题01：导数、偏导数、方向导数、梯度的概念

摘要：目录导数偏导数方向导数梯度参考资料导数导数反映的是函数y=f(x)在某一点处沿x轴正方向的变化率。比如y=x2，在x=1处的导数=2。导数是通过极限来定义的，某一点的导数=tanψ，但是前提是△x趋近于0，此时tanψ=tanα=该点导数，公式如下：返回目录偏导数在多元函数中阅读全文

posted @ 2019-07-01 18:09 黎明程序员阅读(2371) 评论(0) 推荐(2) 编辑

黎明程序员

07 2019 档案

公告