2020.10.26 分割网络
语义分割
FCN:2016,encoder -decoder:空洞卷积,upsampling
Unet:2015,encoder-decoder:upsampling+低分辨的connect
SegNet:2016,encoder-decoder:encoder的时候sampling 的索引在decoder中使用, fig2, fig3.这个就是内存占用上比较少
ENet:2016,encoder-decoder 就是用ResNet作为backbone
LinkNet:2017,encoder-decoder:+FPN
DenseNet:2017,采用的就是densenet的backbone,没什么创新
PixelNet:2016,就是讲前面每个stage的输出全部参与全连接
R2U-Net:2018,用了RNN和resnet 的Unet
BiSeNet:2018,fig2是他的网络, 这个就是增加了分支,一个spatial branch:这个主要是提供空间的信息,还有一个attention context branch这个主要是提供全局的注意力机制
DenseASPP:2018,这个就是densenet+空洞卷积
HRNet:2019,提供了HRNet一个backbone
DFANet:2019,第一页有一个图可以介绍2019年以前的性能分布,decoder的输出分辨率没有降低很多,没有使用SPP,速度快了
DANet:2019
采用了新的注意力机制,矩阵的乘法, 只不过这里用了一个e指数,
position attention model:N C x C N ,这个表示图像每一个位置所有通道和其他位置的所有通道求和, 然后得到 N N的形状
看纸上笔记1
Multi-scale Guided Attention for Medical Image Segmentation:2020, 这个也是深层特征与浅层特征的融合,只不过是融合的方式不太一样而已。他的注意力机制不太一样,它采用两个DANet来进行降低噪声
PortraitNet2020 :肖像分割
deeplab系列:基本满足之前分析的结果,
https://www.cnblogs.com/importGPX/p/13475587.html ,总体分析
实例分割
一般会用two stage的目标检测框架
综述的网络:https://arxiv.org/ftp/arxiv/papers/2007/2007.00047.pdf
2.1 classfication of mask proposals
对mask候选区域的分类网络,
2.2 detection followed by segmentation
这个和第一个是一样的, 但是用的deep learning 进行的目标检测
2.3 labelling pixels followed by clustering
语义分割加上聚类
2.4 dense sliding window methods
这个要学习一下tensorMask
mask RCNN :2017
MASK Scoring RCNN、MS RCNN,2019我们是一IoU 作为性能指标的,所以我们就增加了一个ioUhead 这样计算损失,进而训练,得到的目标就更好
PANet:2018,FPN增加了bottom up这个方向
YOLACT:2019,mobile。fig2中,经过FPN产生的P3产生的是3个mask, 然后另一个branch 产生的是一个系数, 他利用这个系数产生了一个快速的NMS,经过线性的结合,从而得到最终的结果
Tensor Mask