Fork me on GitHub

ESPCN:亚像素卷积神经网络

什么是亚像素

亚像素(Sub Pixel):

面阵摄像机的成像面以像素为最小单位,像素中心之间的距离有几个至十几个微米不等。为了最大限度利用图像信息来提高分辨率,有人提出了亚像素概念。意思是说,在两个物理像素之间还有像素,称之为亚像素,它完全是通过计算方法得出来的。

例如某CMOS摄像芯片,其像素间距为5.2微米。摄像机拍摄时,将物理世界中连续的图像进行了离散化处理。到成像面上每一个像素点只代表其附近的颜色。

两个像素之间有5.2微米的距离,在宏观上可以看作是连在一起的。但是在微观上,它们之间还有无限的更小的东西存在。这个更小的东西我们称它为“亚像素”。


1. CNN 方法与 ESPCN 的区别

2. 网络结构

图 2:ESPCN 网络结构

  1. 形状为 [B, C, N, N] 的输入图像
  2. 第一层:具有 64 个过滤器和 5×5 内核大小的卷积层,然后是一个 tanh 激活层。
  3. 第二层:具有 32 个过滤器和 3×3 内核大小的卷积层,后面是一个 tanh 激活层。
  4. 第三层:卷积层,输出通道数固定为C×r×r,核大小为3×3。
  5. 应用子像素混洗函数,使输出 SR 图像具有 [B, C, r × N, r × N] 的形状,后跟一个 sigmoid 激活层。

图 3:ESPCN 模型

3. 亚像素卷积

图 4:子像素的可视化

图5:pixel shuffle的操作

4.损失函数

图 6:ESPCN 的损失函数

posted @ 2023-02-20 15:06  stardsd  阅读(882)  评论(0编辑  收藏  举报