全卷积神经网络FCN - 未雨愁眸 - 博客园

:: :: :: ::

::

随笔 - 4326, 文章 - 1, 评论 - 32, 阅读 - 280万

公告

昵称：未雨愁眸
园龄： 11年
粉丝： 93
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

全卷积神经网络FCN

卷积神经网络CNN（YannLecun，1998年）通过构建多层的卷积层自动提取图像上的特征，一般来说，排在前边较浅的卷积层采用较小的感知域，可以学习到图像的一些局部的特征（如纹理特征），排在后边较深的卷积层采用较大的感知域，可以学习到更加抽象的特征（如物体大小，位置和方向信息等）。CNN在图像分类和图像检测领域取得了广泛应用。

CNN提取的抽象特征对图像分类、图像中包含哪些类别的物体，以及图像中物体粗略位置的定位很有效，但是由于采用了感知域，对图像特征的提取更多的是以“一小块临域”为单位的，因此很难做到精细（像素级）的分割，不能很准确的划定物体具体的轮廓。

针对CNN在图像精细分割上存在的局限性，UC Berkeley的Jonathan Long等人2015年在其论文 “Fully convolutional networks for semantic segmentation”（用于语义分割的全卷积神经网络）中提出了Fully Convolutional Networks (FCN)用于图像的分割，要解决的核心问题就是图像像素级别的分类。论文链接： https://arxiv.org/abs/1411.4038

FCN与CNN的核心区别就是FCN将CNN末尾的全连接层转化成了卷积层：

以Alexnet为例，输入是2272273的图像，前5层是卷积层，第5层的输出是256个特征图，大小是66，即2566*6，第6、7、8层分别是长度是4096、4096、1000的一维向量。

在FCN中第6、7、8层都是通过卷积得到的，卷积核的大小全部是11，第6层的输出是409677，第7层的输出是409677，第8层的输出是100077（7是输入图像大小的1/32）,即1000个大小是77的特征图（称为heatmap）。

经过多次卷积后，图像的分辨率越来越低，，为了从低分辨率的heatmap恢复到原图大小，以便对原图上每一个像素点进行分类预测，需要对heatmap进行反卷积，也就是上采样。论文中首先进行了一个上池化操作，再进行反卷积，使得图像分辨率提高到原图大小：

对第5层的输出执行32倍的反卷积得到原图，得到的结果不是很精确，论文中同时执行了第4层和第3层输出的反卷积操作（分别需要16倍和8倍的上采样），再把这3个反卷积的结果图像融合，提升了结果的精确度：

最后像素的分类按照该点在1000张上采样得到的图上的最大的概率来定。

FCN可以接受任意大小的输入图像，但是FCN的分类结果还是不够精细，对细节不太敏感，再者没有考虑到像素与像素之间的关联关系，丢失了部分空间信息。

posted on 2018-07-19 14:49 未雨愁眸阅读(2040) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步