CVPR2016 VDSR:Accurate Image Super-Resolution Using Very Deep Convolutional Networks

 

  • 摘要

 

 

  • 问题描述

  何恺明将深度学习技术引入超分辨问题的开山之作SRCNN(2014年),主要存在以下几个问题:

  1、感受野小,使得获取的语义信息少,对于恢复细节信息有难度

  2、收敛很慢

  3、SRCNN只针对单尺度超分

  • 主要贡献点

 1、设计了一个20层的卷积神经网络来做超分辨

2、小的学习率会使的网络收敛很慢,而大的学习率容易使得梯度爆炸,因此通过残差学习和大的学习率及梯度裁剪(gradient cropping)加速收敛

3、设计的一个网络可以同时实现多尺度超分辨

  • 网络结构

 

1、可以看到现将低分辨的图像(LR)进行插值到目标分辨率大小的低分辨率图像(ILR),然后将其作为网络的输入

2、ILR经过D-1次的Conv+ReLU,再经过第D次的Conv层+上ILR图像,作为最终输出图像,可以看出,网络主要学习真实图像与ILR的残差。

  • 训练细节

1、损失函数:其中f(x)表示网络的预测输出,r=y - x, y为真实高分辨图像,x为经过插值的低分辨图像。

2、 optimization methods:SGD,momentum=0.9, weight decay=1e-4

3、Adjustable Gradient Clipping。The gradients are clipped to [-θ/γ; θ/γ ], where γ denotes the current learning rate. And θ is tuned to be small to avoid exploding gradients in a high learning rate regime.

 

4、Multi-Scale Training

可以看到,只用单尺度的图像对训练,那么只在对应的尺度,PSNR最高。而用多尺度的训练,测试的时候不同尺度的结果都是最好的(倒数第二列)

 

 

  • 实验结果

 

paper link:https://cv.snu.ac.kr/research/VDSR/VDSR_CVPR2016.pdf

posted @ 2019-04-02 22:52  琴影  阅读(2557)  评论(0编辑  收藏  举报