随笔分类 - 神经网络
摘要:1、ResNet(残差网络):ResNet通过引入残差学习框架解决了深度网络训练中的退化问题。它通过添加跳跃连接(skip connections)来提高网络的深度,从而提高性能。 2、DenseNet(密集连接网络):DenseNet通过将每一层与前面所有层连接起来,实现了特征的重用和传递。这种结
阅读全文
摘要:建筑图纸中可能包含各种类型的文字,这些文字通常用于标识建筑元素、尺寸、说明等。一般来说,建筑图纸需要识别的文字类型可以分为以下几类: 建筑元素标识文字:用于标识建筑结构、构件、设备等各种元素的文字,例如墙体、门窗、楼层、房间等。 尺寸标注文字:用于标注建筑元素的尺寸、长度、宽度、高度等信息的文字,通
阅读全文
摘要:1、图纸识别研究方向 多目标检测和分割:建筑图纸中可能包含多种目标,例如建筑物、道路、水域等。您可以研究如何设计CNN模型以实现多目标的检测和分割,即同时识别图纸中的多个目标并将其准确地分割出来。 图纸内容理解:建筑图纸通常包含丰富的信息,例如建筑物的结构、房间布局等。您可以探索如何利用CNN模型对
阅读全文
摘要:1、参数计算 在一次卷积过程中,卷积核进行共享,即每个通道采用一个卷积核即可。 在Pytorch的nn模块中,封装了nn.Conv2d()类作为二维卷积的实现。参数如下图所示 in_channels:输入张量的channels数 out_channels:输出张量的channels数 kernel_
阅读全文
摘要:1、数据集 从数据集的来源不同,我们对数据集的导入分为两种: 1.1、从第三方库中导入 使用PyTorch内置的数据集类(如torchvision.datasets.ImageFolder、torchvision.datasets.CIFAR10等),这些类提供了访问常见数据集的简单方法。下面是一个
阅读全文
摘要:1、CNN中常见的名词 padding:padding(填充)参数的作用是决定在进行卷积或池化操作时,是否对输入的图像矩阵边缘补0 stride:滑动卷积核时的步长stride(例如每次滑动一个或两个) kernal:卷积核,通常为3x3或者5x5 filter:卷积核的数量(神经元的数量)。这个地
阅读全文
摘要:1、定义 LeNet是深度学习领域的一个经典卷积神经网络模型,由Yann LeCun等人于1998年提出,被广泛应用于手写数字识别和其他图像识别任务。 LeNet的网络结构相对简单,包含两个卷积层和三个全连接层,是卷积神经网络的基础。 LeNet对于现代的图像识别任务来说可能过于简单,但其对于深度学
阅读全文
摘要:1、卷积神经网络的特点 卷积神经网络相对于普通神经网络在于以下四个特点: 局部感知域:CNN的神经元只与输入数据的一小部分区域相连接,这使得CNN对数据的局部结构具有强大的敏感性,可以自动学习到图像的特征。 参数共享:在CNN中,同一个卷积核(filter)在整个输入图像上滑动,共享权重和偏置。这减
阅读全文
摘要:参考链接:https://blog.csdn.net/weixin_43973089/article/details/115921649 1、基本原理 神经网络由大量的神经元相互连接而成。每个神经元接受线性组合的输入后,最开始只是简单的线性加权,后来给每个神经元加上了非线性的激活函数,从而进行非线性
阅读全文
摘要:1、神经元 神经元是神经网络中的基本单元。 每一个神经元包括两个参数:权重系数和偏置系数b。 神经网络的学习过程就是通过优化更新每一个神经元的权重和偏置系数,使得输出值Y更接近其真实值。 假设神经元的输入向量为 ,那么输出,其中 是该神经元选定的激活函数。 x1、x2表示输入量 w1、w2为权重,几
阅读全文