摘要: LeNet、AlexNet和VGG都有一个共同的设计模式:通过一系列的卷积层与汇聚层来提取空间结构特征;然后通过全连接层对特征的表征进行处理。 AlexNet和VGG对LeNet的改进主要在于如何扩大和加深这两个模块。 或者,可以想象在这个过程的早期使用全连接层。然而,如果使用了全连接层,可能会完全 阅读全文
posted @ 2024-08-04 15:48 codersgl 阅读(23) 评论(0) 推荐(0) 编辑
摘要: 虽然AlexNet证明深层神经网络卓有成效,但它没有提供一个通用的模板来指导后续的研究人员设计新的网络。 之后,我们将介绍一些常用于设计深层神经网络的启发式概念。 与芯片设计中工程师从放置晶体管到逻辑元件再到逻辑块的过程类似,神经网络架构的设计也逐渐变得更加抽象。研究人员开始从单个神经元的角度思考问 阅读全文
posted @ 2024-08-04 14:01 codersgl 阅读(45) 评论(0) 推荐(0) 编辑
摘要: 在LeNet提出后,卷积神经网络在计算机视觉和机器学习领域中很有名气。但卷积神经网络并没有主导这些领域。这是因为虽然LeNet在小数据集上取得了很好的效果,但是在更大、更真实的数据集上训练卷积神经网络的性能和可行性还有待研究。事实上,在上世纪90年代初到2012年之间的大部分时间里,神经网络往往被其 阅读全文
posted @ 2024-08-03 14:42 codersgl 阅读(37) 评论(0) 推荐(0) 编辑
摘要: JupyterLab与Jupyter Notebook:详细比较 简介 Jupyter Notebook是一个开源的Web应用程序,允许用户创建和共享包含实时代码、方程、可视化和解释性文本的文档。JupyterLab是Jupyter Notebook的下一代界面,提供了更高级的功能和更现代化的用户界 阅读全文
posted @ 2024-08-02 23:26 codersgl 阅读(905) 评论(0) 推荐(0) 编辑
摘要: 通过前面的学习我们了解到了构建一个卷积神经网络所需的几个组件。回想一下我们所学过的线性模型,无论是softmax回归还是MLP,它们对于图像的分类都是将二维的图片展平为一维的向量,然后利用全连接层进行处理。而现在我们已经学会了卷积层的处理方法,可以在图像中保留空间结构。同时利用卷积层代替全连接层的另 阅读全文
posted @ 2024-08-02 16:39 codersgl 阅读(12) 评论(0) 推荐(0) 编辑
摘要: 通常当我们处理图像时,我们希望逐渐降低隐藏表示的空间分辨率、聚集信息,这样随着我们在神经网络中层叠的上升,每个神经元对其敏感的感受野(输入)就越大。 而我们的机器学习任务通常会跟全局图像的问题有关(例如,“图像是否包含一只猫呢?”),所以我们最后一层的神经元应该对整个输入的全局敏感。通过逐渐聚合信息 阅读全文
posted @ 2024-08-02 14:43 codersgl 阅读(67) 评论(0) 推荐(0) 编辑
摘要: 在上一篇文章中我们讨论了,CNN中填充和步幅的作用。同时,我们所有的讨论都是基于二维的张量,即不考虑图片的RGB通道,然而在现实生活中我们往往需要处理多通道的图片,比如RGB图片,其通道数为3。那么,我们该如何处理多通道的图片呢? 这里我们为了处理多通道图片,将我们的输入和隐藏层表示都变成三维张量。 阅读全文
posted @ 2024-08-02 12:23 codersgl 阅读(25) 评论(0) 推荐(0) 编辑
摘要: 我们都知道图像在经过卷积处理后,输出图像的尺寸一般会变小,假设输入图像尺寸为\(n_h \times n_w\),卷积核尺寸为\(k_h \times k_w\),经过卷积处理后,输出图像的尺寸为\((n_h-k_h+1)\times (n_w-k_w+1)\)。但是这个过程有个弊端,那就是在经过多 阅读全文
posted @ 2024-08-02 10:02 codersgl 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 在上一篇文章中,我们了解了卷积的原理,下面让我们来看看卷积在图像识别中的具体操作 互相关运算 严格来说,卷积层是一个错误的叫法,因为它表达的运算其实是数学上的互相关(cross-correlation)运算,而不是卷积运算 我们先来看一下二维图像的互相关运算: 在二维互相关运算中,卷积窗口从输入张量 阅读全文
posted @ 2024-08-01 23:44 codersgl 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 学过MLP的小伙伴们都知道,假设我们对一个MLP模型进行图像分类任务时,我们对输入图像的第一步操作就是将一个二维的图像展平为一维作为输出。但这样的处理方式有一个显而易见的缺点——忽略了每张图像的空间结构信息。显然这是不准确的,它会导致我们对于图像的识别率降低。除此之外,使用MLP模型进行图像分类任务 阅读全文
posted @ 2024-08-01 23:02 codersgl 阅读(12) 评论(0) 推荐(0) 编辑