摘要: 详解残差网络为什么有用? 为什么ResNets能有如此好的表现,来看个例子,它解释了其中的原因,至少可以说明,如何构建更深层次的ResNets网络的同时还不降低它们在训练集上的效率。通常来讲,网络在训练集上表现好,才能在Hold-Out交叉验证集或dev集和测试集上有好的表现,所以至少在训练集上训练 阅读全文
posted @ 2024-10-16 10:28 Oten 阅读(83) 评论(0) 推荐(0) 编辑
摘要: 详解残差网络 ResNets是由残差块(Residual block)构建的,首先解释一下什么是残差块。 这是一个两层神经网络,在\(L\)层进行激活,得到\(a^{\left\lbrack l + 1 \right\rbrack}\),再次进行激活,两层之后得到\(a^{\left\lbrack 阅读全文
posted @ 2024-10-15 10:43 Oten 阅读(329) 评论(0) 推荐(0) 编辑
摘要: 详解经典网络 首先看看LeNet-5的网络结构,假设有一张32×32×1的图片,LeNet-5可以识别图中的手写数字,比如像这样手写数字7。LeNet-5是针对灰度图片训练的,所以图片的大小只有32×32×1。实际上LeNet-5的结构和上篇博客的最后一个范例非常相似,使用6个5×5的过滤器,步幅为 阅读全文
posted @ 2024-10-12 10:42 Oten 阅读(68) 评论(0) 推荐(0) 编辑
摘要: 详解为什么使用卷积? 来分析一下卷积在神经网络中如此受用的原因,然后对如何整合这些卷积,如何通过一个标注过的训练集训练卷积神经网络做个简单概括。和只用全连接层相比,卷积层的两个主要优势在于参数共享和稀疏连接,举例说明一下。 假设有一张32×32×3维度的图片,假设用了6个大小为5×5的过滤器,输出维 阅读全文
posted @ 2024-09-25 09:51 Oten 阅读(110) 评论(0) 推荐(1) 编辑
摘要: 详解卷积神经网络示例 假设,有一张大小为32×32×3的输入图片,这是一张RGB模式的图片,想做手写体数字识别。32×32×3的RGB图片中含有某个数字,比如7,想识别它是从0-9这10个数字中的哪一个,构建一个神经网络来实现这个功能。 用的这个网络模型和经典网络LeNet-5非常相似,灵感也来源于 阅读全文
posted @ 2024-09-05 10:48 Oten 阅读(199) 评论(0) 推荐(0) 编辑
摘要: 详解池化层 除了卷积层,卷积网络也经常使用池化层来缩减模型的大小,提高计算速度,同时提高所提取特征的鲁棒性,来看一下。 先举一个池化层的例子,然后再讨论池化层的必要性。假如输入是一个4×4矩阵,用到的池化类型是最大池化(max pooling)。执行最大池化的树池是一个2×2矩阵。执行过程非常简单, 阅读全文
posted @ 2024-09-04 10:07 Oten 阅读(466) 评论(0) 推荐(1) 编辑
摘要: 详解简单卷积网络示例 假设有一张图片,想做图片分类或图片识别,把这张图片输入定义为\(x\),然后辨别图片中有没有猫,用0或1表示,这是一个分类问题,来构建适用于这项任务的卷积神经网络。针对这个示例,用了一张比较小的图片,大小是39×39×3,这样设定可以使其中一些数字效果更好。所以\(n_{H}^ 阅读全文
posted @ 2024-09-03 10:11 Oten 阅读(69) 评论(0) 推荐(0) 编辑
摘要: 详解单层卷积网络 如何构建卷积神经网络的卷积层,下面来看个例子。 已经写了如何通过两个过滤器卷积处理一个三维图像,并输出两个不同的4×4矩阵。假设使用第一个过滤器进行卷积,得到第一个4×4矩阵。使用第二个过滤器进行卷积得到另外一个4×4矩阵。 最终各自形成一个卷积神经网络层,然后增加偏差,它是一个实 阅读全文
posted @ 2024-08-20 12:30 Oten 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 详解三维卷积 从一个例子开始,假如说不仅想检测灰度图像的特征,也想检测RGB彩色图像的特征。彩色图像如果是6×6×3,这里的3指的是三个颜色通道,可以把它想象成三个6×6图像的堆叠。为了检测图像的边缘或者其他的特征,不是把它跟原来的3×3的过滤器做卷积,而是跟一个三维的过滤器,它的维度是3×3×3, 阅读全文
posted @ 2024-08-15 10:02 Oten 阅读(793) 评论(0) 推荐(0) 编辑
摘要: 详解卷积步长 卷积中的步幅是另一个构建卷积神经网络的基本操作,让向展示一个例子。 如果想用3×3的过滤器卷积这个7×7的图像,和之前不同的是,把步幅设置成了2。还和之前一样取左上方的3×3区域的元素的乘积,再加起来,最后结果为91。 只是之前移动蓝框的步长是1,现在移动的步长是2,让过滤器跳过2个步 阅读全文
posted @ 2024-08-14 09:58 Oten 阅读(281) 评论(0) 推荐(0) 编辑