卷积神经网络卷积核滑窗计算
1. 定义背景
- 卷积核(Kernel/Filter):一个小矩阵,用于提取特定的特征,比如边缘、纹理等。
- 图像:可以表示为一个二维矩阵,其中每个元素是像素值。
操作步骤:
- 卷积核覆盖到图像的某一区域(子矩阵)。
- 卷积核和图像的子矩阵对应位置逐元素相乘。
- 将乘积求和,得到一个单一值。
- 按一定步幅(stride)移动卷积核,重复上述操作,生成一个输出矩阵(特征图)
卷积动画
蓝色是输入矩阵,青色是输出矩阵
|
|||
No padding, no strides | Arbitrary padding, no strides | Half padding, no strides | Full padding, no strides |
No padding, strides | Padding, strides | Padding, strides (odd) |
转置卷积动画
蓝色是输入矩阵,青色是输出矩阵
No padding, no strides, transposed | Arbitrary padding, no strides, transposed | Half padding, no strides, transposed | Full padding, no strides, transposed |
No padding, strides, transposed | Padding, strides, transposed | Padding, strides, transposed (odd) |
假设:
- 图像矩阵:
- 卷积核:
- 卷积操作采用:
- 步幅 stride=1
- 无填充(padding)。
第一步:计算第一个位置
卷积核与图像左上角的 2×2 子矩阵重叠:
然后子矩阵和卷积核矩阵点乘:
然后求和: