语义分割:将图片的每个像素按照类别区分开,缺点是无法区分同类别实例

语义分割的一些想法:

1.滑动窗口

 将每一个小窗口通过cnn分类,缺点是计算量非常大

2.全卷积网络:

利用全是卷积层的网络来训练,通过填充保持图片的大小不变,最后分类得到语义分割后的图像,C为类别数量

在深通道(如64,128,256)逐层做卷积操作,非常消耗内存和计算量

 

3.先下采样再上采样

对一小部分卷积层做原清晰度处理,经过一系列下采样,卷积,不使用全连接

 

上采样(去池化):

最邻近去池化:将值赋给附近领域

钉床(Bed of Nails)去池化:将值赋给左上角元素,其余填充零

最大去池化(Max Unpooling):与Maxpooling相对应,将原值赋给对应位置元素,其余填充零

在网络的后半部分用去池化将相应元素放在池化前的相应位置,保存空间的上的结构,

(池化后在低清晰度保留的元素与填充后的小块组成高清晰度的图像,这样可以保证最大池化的元素依然是在相应的位置)

优点:分割的意义就在于找到不同类别的边界,最大池化后在低清晰度会丢失空间信息,去池化后会还原空间信息,帮助预测

 

转置卷积:

 

 

Q1:上采样有哪几种方法?

 

A1:  去池化、转置卷积、双线性插值

Q2:在草稿纸上绘图说明反卷积的过程。

Q3:(思考题)反卷积的步长会对上采样结果带来怎样的变化?

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

1

posted on 2019-07-09 16:07  Manuel  阅读(591)  评论(0编辑  收藏  举报