深度学习相关概念

记录一下学习笔记

卷积层

卷积的作用是提取特征,因此卷积核也叫滤波器。每个卷积核可以生成一个通道,多个卷积核可以发现不同角度的特征,多个卷积层可以捕捉更全局的特征。卷积的具体实现形式如图所示:

img

这里的卷积核为{(1 0 1),(0 1 0),(1 0 1)}

池化层

池化的作用是保留特征,可以使得模型更加关注某些特征是否存在,忽略这些特征具体的位置,降低对位置的敏感度;并且,池化减小了数据大小,可降低后续的计算量。由下图的两种池化方式可以看出,池化相当于在空间范围内做了维度缩减,从而使模型可以抽取更广范围的特征,主要用于降维。

image

  • 最大池化可以获取局部信息,可以更好保留纹理上的特征;如果不用观察物体在图片中的具体位置,只关心其是否出现,则使用最大池化效果比较好。
  • 平均池化往往能保留整体数据的特征,能凸出背景的信息。
  • 随机池化中元素值大的被选中的概率也大,但不是像最大池化总是取最大值。随机池化一方面最大化地保证了Max值的取值,一方面又确保了不会完全是max值起作用,造成过度失真;除此之外,其可以在一定程度上避免过拟合。
全连接层

全连接层在卷积神经网络中起到分类器的作用,如果说卷积层、池化层是将原始数据映射到隐层特征空间的话,全连接层则起到将学到的“分布式特征表示”映射到样本标记空间的作用。

举个例子,通过卷积层卷积神经网络找到了猫的头、尾巴、身子和腿,通过池化层降低了位置的敏感度,此时不管是左上角的尾巴还是右下角的尾巴都是尾巴;全连接层通过这几个特征得出结论,这就是猫,而不是狗。

image

特征通道

可用借助图像的色彩通道来理解。PS中常用的两种模式是RGB通道和CMYK通道,RGB通道分别只的是红色域、绿色域和蓝色域。利用色彩三原色可以调配出所有颜色,也就是说每一种颜色在RGB通道中对应的值是不同的。

image

特征通道也是类似的概念,每个不同的特征在不同的通道中会有不同的表达,通过卷积核卷积可以提取出图像在不同通道下的特征,一个卷积核可以产生一个通道。

上采样

上采样(upsampling):又名放大图像、图像插值;

主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上;

上采样有3种常见的方法:双线性插值(bilinear),反卷积(Transposed Convolution),反池化(Unpooling);

上采样原理:

图像放大几乎都是采用内插值方法,即在原有图像像素的基础上在像素点之间采用合适的插值算法插入新的元素。

插值算法还包括了传统插值,基于边缘图像的插值,还有基于区域的图像插值。

下采样

下采样(subsampled):又名降采样、缩小图像;

主要目的有两个:1、使得图像符合显示区域的大小;2、生成对应图像的缩略图;

其实下采样就是池化;

下采样原理:

对于一副图像Ⅰ尺寸为MN,对其进行s倍下采样,即得到(M/s)(N/s)尺寸的分辨率图像,当然,s应该是M和N的公约数才可以;

如果考虑是矩阵形式的图像,就是把原始图像s*s窗口内的图像变成一个像素,这个像素点的值就是窗口内所有像素的均值或者最大值(也就是Pooling池化操作等)。

对图像的缩放操作并不能带来更多关于该图像的信息, 因此图像的质量将不可避免地受到影响。然而,确实有一些缩放方法能够增加图像的信息,从而使得缩放后的图像质量超过原图质量的。

Pk = Σ Ii / s2

其实下采样就是池化。

采样层是使用 pooling 的相关技术来实现的,目的就是用来降低特征的维度并保留有效信息,一定程度上避免过拟合;

但是pooling的目的不仅仅是这些,他的目的是保持旋转、平移、伸缩不变形等。采样有最大值采样,平均值采样,求和区域采样和随机区域采样等;

池化也是这样的,比如最大值池化,平均值池化,随机池化,求和区域池化等。

posted @   youngalone  阅读(113)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章
· C# 集成 DeepSeek 模型实现 AI 私有化(本地部署与 API 调用教程)
· spring官宣接入deepseek,真的太香了~
点击右上角即可分享
微信分享提示