【超分辨率】—图像超分辨率(Super-Resolution)技术研究
一、相关概念
1.分辨率
图像分辨率指图像中存储的信息量,是每英寸图像内有多少个像素点,分辨率的单位为PPI(Pixels Per Inch),通常叫做像素每英寸。一般情况下,图像分辨率越高,图像中包含的细节就越多,信息量也越大。图像分辨率分为空间分辨率和时间分辨率。通常,分辨率被表示成每一个方向上的像素数量,例如64*64的二维图像。但分辨率的高低其实并不等同于像素数量的多少,例如一个通过插值放大了5倍的图像并不表示它包含的细节增加了多少。图像超分辨率重建关注的是恢复图像中丢失的细节,即高频信息。 在大量的电子图像应用领域,人们经常期望得到高分辨率(简称HR)图像。但由于设备、传感器等原因,我们得到的图像往往是低分辨率图像(LR)。增加空间分辨率最直接的解决方法就是通过传感器制造技术减少像素尺寸(例如增加每单元面积的像素数量);另外一个增加空间分辨率的方法是增加芯片的尺寸,从而增加图像的容量。因为很难提高大容量的偶合转换率,所以这种方法一般不认为是有效的,因此,引出了图像超分辨率技术。
2.图像超分辨率
图像超分辨率(Image Super Resolution)是指由一幅低分辨率图像或图像序列恢复出高分辨率图像。图像超分辨率技术分为超分辨率复原和超分辨率重建。目前, 图像超分辨率研究可分为 3个主要范畴: 基于插值、 基于重建和基于学习的方法。
超分辨率(Super-Resolution)即通过硬件或软件的方法提高原有图像的分辨率,通过一系列低分辨率的图像来得到一幅高分辨率的图像过程就是超分辨率重建。超分辨率重建的核心思想就是用时间带宽(获取同一场景的多帧图像序列)换取空间分辨率,实现时间分辨率向空间分辨率的转换。
3.与其他图像处理技术的关系
图像修复技术 VS 图像超分辨率技术: 图像修复的目标是恢复一个被模糊或者噪声破坏的图像,但是它不改变图像的尺寸。事实上图像修复和SR复原在理论是完全相关的,超分辨率技术可以看作是第二代图像修复技术,主要区别是图像修复技术在处理后图像中的像素数并不增加。
图像插值 VS 图像超分辨率:图像插值,即增加单幅图像的尺寸。一般的插值并不能恢复LR采样过程中丢失的高频信息,但是图像超分辨率可以,因此图像插值方法不能被认作是SR技术。
图像锐化 VS 图像超分辨率: 图像锐化可以提升高频信息,但仅增强已有的高频成分;超分辨率技术能估计出原始图像中没有表现出来的高分辨率细节。
图像拼接 VS 图像超分辨率: 图像拼接虽然将多幅图像结合成更大的图像,包含了更多的像素,但没有提供更多的细节信息,所以不能算是超分辨率技术。
4.超分辨率技术分类
A.按领域分类
(1)基于频域的方法
主要是傅里叶变换及其逆变换。由于图像细节是通过高频信息反映出来的,所以消除低分辨率图像里的频谱混叠就可以获得更多被掩盖掉的高频信息,从而增加图像细节,提高图像的分辨率。
优点:原理清晰,理论推导方便,计算复杂度较低;
缺点:只适用于空间不变噪声的情况,只能处理图像中仅有整体运动而没有局部运动的情况,难于在处理过程中利用先验信息。
(2)基于空域的方法
空域的方法常利用图像局部的信息进行,增加像素的数量和紧密程度,从而增加图像细节,提高图像的分辨率。
优点:种类多,可将各种退化因素综合考虑,灵活性强;
缺点:设计复杂,计算复杂度较高。
B.根据所用低分辨率图像的数量分类
(1)基于单幅图像的超分辨率(SISR)
输出是单幅图像。 包含:图像放大(图像尺寸或像素的增加)、超分辨率复原(利用点扩散函数和目标的先验知识,在图像系统的衍射极限之外复原图像信息)。
(2)基于多幅图像的超分辨率(MISR)
输出的可以是单幅图像也可以是一个图像系列(常为视频)。其基本前提是通过同一场景可以获取多幅LR细节图像,每一幅LR图像都会为HR图像的复原提供一些不同的信息,如果能够合成这些HR图像,那么SR图像复原是可以实现的。
C.根据技术本身的特点分类
(1)基于重建的超分辨率
基于重建的超分辨率复原方法是对图像的获取过程建立观测模型,然后通过求解观测模型的逆问题来实现超分辨率重建。观测模型描述了成像系统从高分辨率场景 (图像)获取低分辨率观测图像的过程。
从本质上讲,利用单幅或多幅LR观测图像获取HR观测图像是求解观测问题的逆问题,它是一个病态反问题。
关键步骤:配准、重建。 配准是将多幅同一场景的LR图像在空间上进行亚像素精度对齐, 得到高低分辨率图像彼此之间的运动偏移量, 构建观测模型中的空间运动参数。重建是采用不同的先验约束条件 (平滑性、非负性和能量有限性等) 和最优化求解方法进行HR图像的求解。
典型方法:非均匀插值法、迭代反投影法、最大后验概率法(目前实际应用和科学研究中运用最多的一种方法)、凸集投影法。
(2)基于学习的超分辨率
借助预先的训练学习(从数据库)来寻找或建立低分辨率图像与其对应的高分辨率图像之间的映射关系,提取高频信息,从而在给定低分辨率图像的情况下,通过优化方法获得相应的高分辨率图像。
浅层学习:特征提取–>学习–>重建
深度学习:特征提取–>非线性映射–>图像重建
二、基于深度学习的超分辨率重建方法整理
1、SRCNN
Super-Resolution Convolutional Neural Network(PAMI 2016, 代码)
该方法对于一个低分辨率图像,先使用双三次(bicubic)插值将其放大到目标大小,再通过三层卷积网络做非线性映射,得到的结果作为高分辨率图像输出。
PS:推荐使用https://paperswithcode.com/sota了解计算机视觉领域state-of-the-art的方法(SR篇参考如下图):
引用与推荐:
https://github.com/idealo/image-super-resolution
CVPR 2019 | 旷视提出超分辨率新方法 Meta-SR:单一模型实现任意缩放因子
https://www.jianshu.com/u/714ef2c2b866(她有好几篇分析相关paper的文章)
ESRGAN:基于GAN的增强超分辨率方法(附代码解析)(机器之心的PaperWeekly系列都是精品)
从网络设计到实际应用,深度学习图像超分辨率综述(2019.2 最新的综述)
Zoom to Learn, Learn to Zoom(CVPR2019,改进了原始数据集,https://github.com/ceciliavision/zoom-learn-zoom)