卷积神经网络为什么可以学习图像中的信息??

最近在思考,为什么卷积神经网络可以学习到图像中的信息???故而做了一个小笔记。

参考链接

前人之述详备,此仅为我之浅思

浅析卷积神经网络为何能够进行特征提取

特征值和特征向量意义-告诉了我:特征向量使我们可以找到数据在各个维度区分度达到最大的坐标轴,进而获得最有效的信息


下述网址主要为一些补充,实际只要看上面两个链接里的内容就可以了

为什么卷积能够提取图像的特征?看完此文应该能够给你一个答案


卷积神经网络的所谓提取特征、学习图像分布,实际上不过是通过误差的反向传播,调整卷积核(滤波器)的参数,使得对图像中的特定形式的局部,在被卷积核乘的以后,能被强调出来,从而获得最大程度的信息。此即为我所理解的卷积学习到的图像中的信息。

特征值对应的特征向量是理想中的正确的坐标轴,可以最大程度的获得信息


一张图像被读入计算机,是以多维数组的形式被图片知晓的。

例如一张黑白的图片

其中橙色框里的部分,在计算机中的形式可能如下:

我们知道,这样的弧度弯曲,对于一个二维图像小老鼠来说,就是它的臀部特征。其他的二维简笔画老鼠的屁股也大概都是这样的弧度与轮廓。


在卷积神经网络中的卷积层中,我们知道主要是利用卷积核来提取物体的特征。

而利用卷积核充当滤波器,把自己想得到的内容从大量、冗杂的信息中提取出来。这是如何做到的呐?


在数学方法中,这种提取物体特征的方法所利用的就是特征向量。

可以说卷积核==特征向量!

一个向量的特征向量可以做到这么一个效果:这个特征向量对原来的矩阵起到的作用是拉伸,相当于一个系数。使得所有类似的特征在经过一系列的运算以后,会得到一个非常明显的大的值。而无关的特征,得到的就是0。

对于现实中不同弯曲程度的图像的不同的局部特征,我们知道如果想要获得这些部位的信息,需要选择一个合适的坐标系。而通过特征向量和特征值,就可以找到这样的正确的坐标轴。详见链接后半部分内容

在卷积神经网络中,我们会发现:卷积核(也就是特征向量)一旦遇到它所对应的特征,此时进行的乘积就会是非常大的值

对于上面的卷积:(5030)+(5030)+(5030)+(2030)+(50*30)=6600;

我们就可以认为,这个地方的特征被提取出来了。而一旦遇到类似图片,那么其中的值也可以被发现。

对于不能识别的特征,计算的值非常小,如下:

值为0。

如此,不符合的特征就不会被提取。

而在卷积神经网络中,所求的参数其实就是这么一个个卷积核。所谓的学习,就是不断的调整参数,使卷积核逼近理想中的特征向量。

误差反向传播,所计算的就是一层层的卷积核的集合。

本文作者:小澳子

本文链接:https://www.cnblogs.com/xiaoaozi/p/15795065.html

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   小澳子  阅读(631)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
点击右上角即可分享
微信分享提示
💬
评论
📌
收藏
💗
关注
👍
推荐
🚀
回顶
收起
🔑
  1. 1 404 not found REOL
404 not found - REOL
00:00 / 00:00
An audio error has occurred.