左列的X是输入的图像(此处channel是3,也可以理解为RGB,色彩图像),中间红色的列是我们的kernel(即3*3的filter),共两个(即输出的feature通道为2)。最后一列为卷积之后的特征(由于是2个kernel,输出通道为2)。
那么,由上面的过程可以看出,输入是3维(height*width*channel)的,kernel实际上也是三维的。网络卷积网络特征变化可以用下图表示: