语义分割

语义分割：将图片的每个像素按照类别区分开，缺点是无法区分同类别实例

语义分割的一些想法：

1.滑动窗口

　将每一个小窗口通过cnn分类，缺点是计算量非常大

2.全卷积网络：

利用全是卷积层的网络来训练，通过填充保持图片的大小不变，最后分类得到语义分割后的图像，C为类别数量

在深通道（如64，128，256）逐层做卷积操作，非常消耗内存和计算量

3.先下采样再上采样

对一小部分卷积层做原清晰度处理，经过一系列下采样，卷积，不使用全连接

上采样（去池化）：

最邻近去池化：将值赋给附近领域

钉床(Bed of Nails)去池化:将值赋给左上角元素，其余填充零

最大去池化(Max Unpooling)：与Maxpooling相对应，将原值赋给对应位置元素，其余填充零

在网络的后半部分用去池化将相应元素放在池化前的相应位置，保存空间的上的结构，

（池化后在低清晰度保留的元素与填充后的小块组成高清晰度的图像，这样可以保证最大池化的元素依然是在相应的位置）

优点：分割的意义就在于找到不同类别的边界，最大池化后在低清晰度会丢失空间信息，去池化后会还原空间信息，帮助预测

转置卷积：

Q1：上采样有哪几种方法？

A1: 去池化、转置卷积、双线性插值

Q2：在草稿纸上绘图说明反卷积的过程。

Q3：（思考题）反卷积的步长会对上采样结果带来怎样的变化？

posted on 2019-07-09 16:07 Manuel 阅读(591) 评论(0) 编辑收藏举报