卷积神经网络为什么可以学习图像中的信息??
最近在思考,为什么卷积神经网络可以学习到图像中的信息???故而做了一个小笔记。
参考链接
前人之述详备,此仅为我之浅思
特征值和特征向量意义-告诉了我:特征向量使我们可以找到数据在各个维度区分度达到最大的坐标轴,进而获得最有效的信息
下述网址主要为一些补充,实际只要看上面两个链接里的内容就可以了
卷积神经网络的所谓提取特征、学习图像分布,实际上不过是通过误差的反向传播,调整卷积核(滤波器)的参数,使得对图像中的特定形式的局部,在被卷积核乘的以后,能被强调出来,从而获得最大程度的信息。此即为我所理解的卷积学习到的图像中的信息。
特征值对应的特征向量是理想中的正确的坐标轴,可以最大程度的获得信息
一张图像被读入计算机,是以多维数组的形式被图片知晓的。
例如一张黑白的图片

其中橙色框里的部分,在计算机中的形式可能如下:

我们知道,这样的弧度弯曲,对于一个二维图像小老鼠来说,就是它的臀部特征。其他的二维简笔画老鼠的屁股也大概都是这样的弧度与轮廓。
在卷积神经网络中的卷积层中,我们知道主要是利用卷积核来提取物体的特征。
而利用卷积核充当滤波器,把自己想得到的内容从大量、冗杂的信息中提取出来。这是如何做到的呐?
在数学方法中,这种提取物体特征的方法所利用的就是特征向量。
可以说卷积核==特征向量!
一个向量的特征向量可以做到这么一个效果:这个特征向量对原来的矩阵起到的作用是拉伸,相当于一个系数。使得所有类似的特征在经过一系列的运算以后,会得到一个非常明显的大的值。而无关的特征,得到的就是0。
对于现实中不同弯曲程度的图像的不同的局部特征,我们知道如果想要获得这些部位的信息,需要选择一个合适的坐标系。而通过特征向量和特征值,就可以找到这样的正确的坐标轴。详见链接后半部分内容
在卷积神经网络中,我们会发现:卷积核(也就是特征向量)一旦遇到它所对应的特征,此时进行的乘积就会是非常大的值。
对于上面的卷积:(5030)+(5030)+(5030)+(2030)+(50*30)=6600;
我们就可以认为,这个地方的特征被提取出来了。而一旦遇到类似图片,那么其中的值也可以被发现。
对于不能识别的特征,计算的值非常小,如下:
值为0。
如此,不符合的特征就不会被提取。
而在卷积神经网络中,所求的参数其实就是这么一个个卷积核。所谓的学习,就是不断的调整参数,使卷积核逼近理想中的特征向量。
误差反向传播,所计算的就是一层层的卷积核的集合。
本文作者:小澳子
本文链接:https://www.cnblogs.com/xiaoaozi/p/15795065.html
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· Manus重磅发布:全球首款通用AI代理技术深度解析与实战指南
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· 【自荐】一款简洁、开源的在线白板工具 Drawnix