手写数字识别CNN笔记

CNN 有2大特点：

典型的 CNN 由3个部分构成：

　　卷积是当把一个函数“翻转”并移位x时，测量f和g之间的重叠。当为离散对象时，积分就变成求和。

　　卷积核特性：平移不变性，局部性

填充和步幅

在应用多层卷积时，我们常常丢失边缘像素。由于我们通常使用小卷积核，因此对于任何单个卷积，我们可能只会丢失几个像素。但随着我们应用许多连续卷积层，累积丢失的像素数就多了。解决这个问题的简单方法即为填充（padding）：在输入图像的边界填充元素（通常填充元素是0）。

重点：　　

　　卷积神经网络中卷积核的高度和宽度通常为奇数，例如1、3、5或7。选择奇数的好处是，保持空间维度的同时，我们可以在顶部和底部填充相同数量的行，在左侧和右侧填充相同数量的列。

　　1. 卷积核的大小是奇数； 2. 所有边的填充行数和列数相同； 3. 输出与输入具有相同高度和宽度则可以得出：输出Y[i, j]是通过以输入X[i, j]为中心，与卷积核进行互相关计算得到的。

步幅：可以减小输出的高和宽，例如输出的高和宽仅为输入的高和宽的1/n（n是一个大于1的整数）。

LeNet:　　

　　它是最早发布的卷积神经网络之一，因其在计算机视觉任务中的高效性能而受到广泛关注。这个模型是由AT&T贝尔实验室的研究员Yann LeCun在1989年提出的（并以其命名），目的是识别图像 [LeCun et al., 1998]中的手写数字。

LeNet（LeNet-5）由两个部分组成：

posted @ 2022-04-20 22:18 GIPV 阅读(108) 评论(0) 收藏举报

刷新页面返回顶部