论文阅读:InvDN(2021-CVPR)
题目:Invertible Denoising Network: A Light Solution for Real Noise Removal(CVPR-2021)
paper:https://arxiv.org/abs/2104.10546
code:https://github.com/Yang-Liu1082/InvDN.git
动机:
CNN去噪模型变得越来越大和复杂,不利于部署。可逆网络适用于小型设备。
可逆网络在以下三个方面具有优势:1)模型是轻的,因为编码和解码使用相同的参数;2)保留了输入数据的细节,因为可逆网络是信息无损的;3)它们在反向传播期间节省内存,因为它们使用恒定的内存量来计算梯度,而不管网络的深度如何。
目标:
采用可逆网络来解决图像去噪问题。
难题:
1)传统可逆模型的原始输入和反向结果遵循相同的分布(图像生成和缩放)。然而对于图像去噪,输入是有噪声的,恢复的图像是干净的,遵循两种不同的分布。2)可逆变换在变换过程中不会丢失任何信息,然而这种无损特性对于图像去噪是不期望的,因为将输入图像转换为潜在变量时,噪声信息仍然存在。
解决方法:在可逆变换过程中分离出有噪声和干净的信号,就可以重建一个干净的图像,不用担心放弃有噪声的信息而丢失任何重要的信息。
设计:
现有的算法通常使用带填充的卷积层来提取特征,填充使网络不可逆;其次,卷积的参数矩阵可能不是满秩的 。为了确保可逆性,而不是使用卷积层,有必要利用可逆特征提取方法,例如Squeeze层( 将输入按照棋盘模式重塑为具有更多通道的特征映射 )和Haar Wavelet Transformation( 提取原始输入的平均池化以及垂直、水平和对角导数 )。 用可逆方法提取的特征图的空间尺寸必然会缩小。
采样理论表明,在下采样过程中,高频信号被丢弃。由于可逆网络是信息无损的,如果使变换后的表示的前三个通道与下采样的干净图像相同,高频信息将被编码在剩余的通道中。因此,目标不是直接分离干净和有噪声的信号,而是分离有噪声图像的低分辨率和高频分量。
基于高频信息也包含噪声,在反演之前放弃所有高频表示,以从低分辨率分量重建干净的图像。
由于X_HF和n难以分离,所以放弃了代表它们的通道信息,用来消除噪声。丢失了图像高分辨率信息。
解决方法: 即从先验分布中抽样一个新的潜在变量,并将其合并到低分辨率图像中,去重构高分辨率图像。
核心:
InvDN 将噪声输入转换为低分辨率的干净图像和包含噪声的潜在表示。为了去除噪声并恢复干净的图像,InvDN 将带有噪声的潜在表示替换为在还原过程中从先验分布中采样的另一个表示。
创新:
1)设计可逆网络用于真实图像去噪;
2)和传统可逆网络的输入和反向输出遵循相同的分布不同的是,InvDN有两个遵循两种不同分布的潜在变量,输入和恢复的结果遵循两种不同的分布。将噪声输入转换为低分辨率的干净图像以及包含噪声的潜在表示。
3)既可以去除噪声,又可以产生噪声,可用于噪声去除和新噪声图像的生成。
网络结构:
首先采用监督方法来引导网络在转换期间分离高频和低分辨率分量,对应loss:
使用逆变换g^-1对g(y)_LR进行恢复干净图像,对应loss:
同时利用向前和向后的目标来训练可逆变换g。
可逆变换g是一种多尺度架构,由几个下尺度块组成。每个降尺度块由可逆小波变换和一系列可逆块组成:
每个降尺度块中的小波变换层将表示分成低频和高频信号,这些信号由一系列可逆块进一步处理。低频特征可以通过这种方法传递到深层。使用残差块作为操作φ2、φ3和φ4。