Lecture 3 -- CNN

1. Fully Connected Layer v.s. Convolutional Layer


模型架构比较简单,不做赘述。

一个neuron负责同一大小的不同的receptive field

负责同一大小receptive field的不同neuron之间参数不共享。

一个3x3filter并不是只能看到原始图像上3x3大小的pattern

当在feature map上应用3x3的卷积核时,相当于看到了原始图像上更大的区域。

池化层并不属于一个layer,因为它没有参数!

 

 

2. Application -- Alpha Go


目前越来越多的卷积网络架构不再使用池化层,因为池化层的主要目的是为了减少参数。

针对一些比较粗略的图像识别,或许使用池化层是合适的,因为一张图片除去某几行/几列,并不影响我们对图像内容的判断。

但是像Alpha Go就没有使用池化层,因为他的输入是一张棋盘,而棋盘除去某几行/几列,就破坏了整个棋局的完整性。

因此,我们是否应该使用池化层,应该根据实际的任务进行考虑!

 

 

3. Shortcoming


卷积无法很好的分辨经过缩放和旋转的图像,因此我们需要做数据增强!

有一种模型架构可以处理这个问题:Spatial Transformer Layer

 

 

 


END
posted @ 2023-07-24 18:24  Peg_Wu  阅读(14)  评论(0编辑  收藏  举报