FocusNet: Imbalanced Large and Small Organ Segmentation with an End-to-End Deep Neural Network for Head and Neck CT Images(理解)

原文链接

扫码关注下方公众号:"Python编程与深度学习",领取配套学习资源,并有不定时深度学习相关文章及代码分享。

 

今天分享一篇发表在MICCAI 2019上的关于医学影像处理中小器官分割的论文:FocusNet: Imbalanced Large and Small Organ Segmentation with an End-to-End Deep Neural Network for Head and Neck CT Images (原文链接:[1])。

1 研究背景

器官分割是医学影像处理中的一类主要任务,现在主流的方法是采用卷积神经网络进行处理。但是不同的器官之间的大小具有很大的差距,如上图所示,晶状体(最小的器官)只占整个3D空间的0.0028%,而腮腺所占区域大约是晶状体的250倍,不同器官之间所占空间的比例是不平衡的。然而,现有的分割神经网络并没有针对这个问题进行优化,这些网络一般能对大器官产生准确的分割图,但对小器官的分割精度往往是不高的。

为了解决上述大小器官分割任务中存在的占比不平衡问题,这篇文章模拟了专家标注的过程。作者发现,对于大器官,专家通常在正常视图下进行标注,而对于小器官,他们先在正常视图下找到对应的位置,然后放大进行标记。受此启发,这篇文章提出了一种新颖的端到端三维卷积神经网络 (FocusNet),同时对大器官和小器官产生精确的分割。

2 方法

2.1 整体流程

如上图(Fig.1)所示,FocusNet接受3D的CT扫描图作为输入,其具体流程为:

  1. 通过主分割网络 (S-Net)对大器官预测分割图
  2. 同时以S-Net的最后一层特征作为SOL-Net的输入,预测小器官的大概位置
  3. 根据第2步预测的位置截取对应区域的多尺度特征和高分辨率特征作为输入(这里采用ROI Pooling确保输入特征维度的一致性),采用SOS-Net预测小器官的分割图
  4. 融合第1步和第3步的预测结果得到最终的预测

通过上述具体流程的描述,可以将FocusNet分为三个主要子网络:S-Net、SOL-Net和SOS-Net,接下来将对这几个部分分别进行详细的介绍。

2.2 主分割网络 (S-Net)

文中通过主分割网络预测大器官的分割图,如上图所示(Fig.2)。作者在文中说明了直接采用3D U-Net在这个任务上的效果并不好,原因有:

  1. 3D U-Net存在4次下采样过程,然而过多的下采样会导致高分辨率信息的丢失,这将非常不利于对只占有少数体素的小器官进行预测
  2. 3D U-Net只能通过下采样的方式捕获固定尺度的特征,这限制了它的表示能力(即没有采用类似ASPP模块)

文中提出了S-Net作为主分割网络来避免上述的局限性。S-Net的设置如下:

  • 输入:3D的CT扫描图
  • 输出:大器官的预测分割图
  • 结构: 如Fig.2绿色箭头所示,S-Net只采用一次下采样,同时为了捕获多尺度的特征信息并且扩充感受野,采用DenseASPP模块
  • 损失函数:Focal Loss+Dice Loss

2.3 小器官定位网络 (Small-Organ Localization Network, SOL-Net)

通过S-Net已经可以预测大器官的分割图了,接下来需要通过SOL-Net模拟专家标注中定位小器官位置的过程。SOL-Net的设置如下:

  • 输入:S-Net的最后一层解码器的特征
  • 输出:小器官中心位置的概率热图 (heatmap),每一个小器官都有一个单独的热图(假设小器官类型数量是$K$,那么预测结果的通道数为$K$)
  • 结构:由2个Squeeze-and-Excitation Residual Blocks (SEResBlock)和一个1x1x1卷积层组成,最后一层的激活函数为Sigmoid
  • 损失函数:MSE Loss

2.4 小器官分割网络 (Small-Organ Segmentation Network, SOS-Net)

通过SOL-Net获得了小器官的位置之后,需要聚焦到相应的小块区域,再用SOS-Net在这个小区域内对小器官进行精确分割。SOS-Net的设置如下:

  • 输入:SOL-Net的输出取概率值最大的位置作为各类小器官的位置,第一部分输入为采用ROI-Pooling在SOL-Net的输出中提取各类小器官位置周围的特征,第二部分输入为采用ROI-Pooling提取S-Net解码器 (decoder)最后一层多尺度特征以及S-Net编码器 (encoder)第一层特征各类小器官位置周围的特征,两部分输入相加起来作为输入
  • 输出:各类小器官的分割图
  • 结构:由2个Squeeze-and-Excitation Residual Blocks (SEResBlock)和一个1x1x1卷积层组成

3 实验结果

这里我只给出论文中的部分实验结果,具体的实验结果分析以及实验和参数的设置请看原文。

4 参考资料

[1] https://arxiv.org/pdf/1907.12056

posted @ 2020-06-22 11:20  CZiFan  阅读(646)  评论(0编辑  收藏  举报