Image Super-Resolution Using Deep Convolutional Networks SRCNN 论文解析

Image Super-Resolution Using Deep Convolutional Networks SRCNN 论文解析

Q1:论文试图解决的问题

本文试图解决从低分辨率图片重建高分辨率图片的问题。传统上已有许多解决办法，但存在诸多弊端，传统方法上存在的一部分问题被本文提出的方法解决。

传统的稀疏编码方法运行速度慢，且需要将图片进行切割，每一部分单独还原。本文提出的轻量级模型能够快速重建图像，无需将图片进行切割处理，并能达到SOTA。
传统超分辨率方法重建图像需要众多步骤(pipeline)，且每个步骤需要单独优化，本文提出的模型能够同时对所有层次同时进行优化。
传统超分辨率重建方法大多数仅能用于单一通道（灰度图像），本文提供的方法能够用于多个通道(RGB)。

Q2:这是否是一个新的问题？

并非新问题。在早期已有很多关于超分辨率的研究，包括通过数值计算的插值重建法、通过传统机器学习的稀疏编码、随机森林等方法。本文的意义在于对传统方法的重大改进。

Q3:这篇文章要验证一个什么科学假设？

新提出的SRCNN模型，在精度、速度上都能达到SOTA。
传统的稀疏编码模型，本质上和卷积神经网络等价。

Q4 有哪些相关研究？如何归类？谁是这一课题在领域内值得关注的研究员？

在本文提出的时间段之前，相关研究主要分为四种

prediction model
edge based methods
image statistical methods(基于统计的方法如图像插值等)
example-based methods(基于样本的方法机器学习如稀疏编码超分辨率在本文提出前是SOTA)
本文提出的基于卷积神经网络的方法(开创性论文)

值得关注的研究员:

高新波

Ming-Hsuan Yang

汤晓鸥

Q5 论文中提到的解决方案之关键是什么？

论文中SRCNN模型主要分为四个步骤，首先输入原始低分辨率图像，对低分辨率图像进行bicubic (双立方插值)，得到目标大小的图像，接下来将图像传入卷积层。第一个卷积层用于提取低分辨率的图像特征，第二个卷积层使用1x1卷积核，进行非线性映射，最后一个卷积层将映射后的特征图进行重建，得到目标图像。

Q6论文中的实验是如何设计的？

首先实验不同数据集对模型的影响，接下来，改变网络的架构、滤波器数量、滤波器大小等因素，探究对性能的影响，并与传统的SOTA方法对比。由于传统方法只处理单通道，因此对比实验也仅使用单通道。最后，将模型应用于彩色图片上，评估性能。

Q7用于定量评估的数据集是什么？代码有没有开源？

使用的数据集为“ILSVRC 2013 ImageNet”(395,909 张图片)，及来自"Image super-resolution via sparse representation "论文中提出的小数据集(91张图片）。

Q8论文中的实验及结果有没有很好地支持需要验证的科学假设？

本文的实验结果证明，使用CNN的方法进行超分辨率重建，效果和速度要远好传统的几种方法。

Q9这篇论文到底有什么贡献？

主要的贡献在如下三个方面:

提出了端到端的、基于卷积神经网络的超分辨率重建方法，该方法基本不需要任何的图像预处理。
建立了卷积神经网络和稀疏编码超分辨率方法之间的联系，解释了SRCNN各层的含义，这种解释为SRCNN层次设计提供了依据。
揭示了卷积神经网络在处理传统计算机视觉问题(超分辨率重建)上的有效性，并且可以达到很高的质量和速度。

Q10下一步呢？有什么工作可以继续深入？

损失函数可以加以改进，作者在文中提出，使用MSE并不能准确表达出图片在结构上的相似性，在有些情况下，图片复原效果不佳，但MSE反而更低。
文中指出使用更深的网络、更复杂的网络结构可以提高图像重建表现。但受限于当时的算力没有继续改进。

posted @ 2022-08-07 10:53 alexhe101 阅读(319) 评论(0) 收藏举报

刷新页面返回顶部