文献阅读——Dynamic Range Compression Preserving Local Image Contrast for Digital Video Camera

Dynamic Range Compression Preserving Local Image Contrast for Digital Video Camera

数字摄像机中保持局部图像对比度的动态范围压缩

摘要

本文提出了一种新的数字摄像机动态范围压缩方法。该算法的目的是在像素和周围注意力区域的亮度比来保持局部对比度。通常,数字视频摄像机需要将阴影保持到中间范围亮度,这样的阴影区域往往包括主要对象,例如人脸区域。根据该要求,大多数数字视频摄像机已经采用拐点曲线作为动态范围压缩函数,仅压缩拐点以上的高亮区域。但是这种方法具有严重降低高亮区域对比度的缺点。为了克服这一弱点,该算法自动和自适应地增强高亮区域的局部图像对比度。结果显示,在不抑制阴影到中间亮度的情况下,逼真地再现了诸如蓝天的高亮区域。

关键词

数码摄像机、动态范围压缩、拐点函数、局部对比度

I.介绍

数字视频摄像机通常具有捕获具有约200%至600%亮度水平的高动态范围(high dynamic range, HDR)图像的能力,而大多数显示设备具有仅具有约110%亮度水平的低动态范围(low dynamic range, LDR)。因此,动态范围压缩技术对于显示由数字视频摄像机捕获的图像是必不可少的。在许多情况下,通过动态范围压缩来保持阴影到中间亮度范围中的输入水平,从而不降低诸如面部区域的主被摄体的亮度。因此,大多数传统的数字摄像机采用拐点曲线作为动态范围压缩函数。如图1所示,该方法强烈地压缩了拐点上的高光范围,因此高光区域(例如天空区域)中的对比度大大降低。在此基础上的改进算法会使用自动拐点函数曲线。该方法旨在通过根据最大亮度水平或高光区域中的像素数量调整拐点,自适应地为高光范围分配更多的色调级别。然而,自动膝关节略微提高了高光对比度,而不是降低中间范围内的亮度。

无法显示图片

图1 传统拐点曲线和自动拐点曲线

这些技术是空间不变的算法,与传统的高动态范围压缩算法[1-4]一样,它们将单个色调映射曲线均匀地应用于整个图像。这些方法的优点在于它们的简单性和计算效率,通过使用查找表的一对一映射。然而,使用单调增加的色调映射曲线很难同时保持阴影和高光区域的视觉对比度。

另一方面,最近提出了一些空间变化色调映射算法[5,6]。由于它们将不同的变换应用于图像的不同部分,因此它们实现了灵活的色调映射。一些以前的工作,如Fattal等人[7]表明,重要的是色调再现保持局部图像对比度,这意味着像素与其局部周围的亮度比。此外,Jobson等人[8]提出了一种基于Land的“retinex”理论[9]的动态范围压缩方法,该理论是亮度和颜色感知的视觉模型。他们的中心/环绕模型通过取像素亮度与其低通滤波的对数比来去除空间变化的光源。Chiu等人也提出了类似的算子[10]。然而,之前的大多数空间变化色调映射算法都没有阐明色调映射水平与局部图像对比度之间的关系。因此,很难将这些方法应用于数字视频摄像机的动态范围压缩,因为基本色调映射曲线应易于控制,以保持阴影到中等的亮度映射,同时保持在任何亮度水平下,视觉对比度尽可能与原始相同。此外,以前的工作需要很多参数,充分设置参数也是相当困难的[11]。

为了解决这些问题,本文提出了一种新的数字视频摄像机动态范围压缩算法[12]。

我们假设,如果在任何像素的局部对比度不改变,视觉对比度也被保留。基于这一假设,我们首先开发了一种新的算子来保持局部对比度。该算子根据给定的基本色调映射曲线,自动增强局部对比度,并在任何亮度水平下保持其接近原始图像。第二节介绍了这一算子。

接下来,我们尝试将此算子应用于数字摄像机的动态范围压缩。特别地,为了保持高光对比度而不降低阴影到中间范围亮度的质量,应当适当地确定基本色调映射曲线。第三部分介绍了数码摄像机基本色调映射曲线的功能设计方法。

应用所提出的算法,捕获的图像在任何亮度水平都可以再现逼真的高对比度。在第四节中,实验证明了所提出的算法的性能。

最后,第五节介绍了结论和讨论情况。

II.NOVEL OPERATOR FOR PRESERVING LOCAL IMAGEC ONTRA

视觉对比度高度依赖于局部对比度,局部对比度是指像素与其局部周围的亮度比。但空间不变的色调映射曲线无法保持局部图像对比度。另一方面,我们提出了一种新的算子以保持局部对比度。我们称之为局部对比度范围变换LCRT(Local Contrast Range Transform)。
LCRT的概念如图2所示。

无法显示图片

图2 LCRT概念图

保持局部对比度的数学条件描述如下。

(1)g(x,y)gave(x,y)=f(x,y)fave(x,y)

这里,f(x,y),fave(x,y)表示输入图像(x,y)处的亮度和局部平均亮度,g(x,y),gave(x,y)分别表示每个像素(x,y)的输出亮度水平和输出局部平均亮度。通过对(1)的两边取对数,等式重写如下,

(2)G(x,y)Gave(x,y)=F(x,y)Fave(x,y)

其中,F(x,y),Fave(x,y),G(x,y),Gave(x,y)分别表示f(x,y),fave(x,y),g(x,y),gave(x,y)的对数值。等式(2)表示在对数域中保持像素值与其局部平均值之间的差的数学条件。根据该条件,保持局部对比度的色调映射函数应满足以下等式。

(3)G(x,y)=P(F(x,y))+{1dP(F(x,y))dF(x,y)}(F(x,y)Fave(x,y))

其中P(F(x,y))表示双对数域中的任意色调映射曲线。该方程通过一阶泰勒展开近似如下,

(4)P(Fave(x,y))P(F(x,y))+{dP(F(x,y))dF(x,y)}(Fave(x,y)F(x,y))

此外,假设近似满足以下等式。

(5)Gave(x,y)P(F(x,y))

(4)(5)代替(2),则导出(3)
这里,将P(F(x,y))转换到亮度域可表示为p(f(x,y))(3)被重写为作为LCRT的基本公式的以下等式(参见附录)。

(6)g(x,y)=p(f(x,y))×q(f(x,y),fave(x,y))

在该等式中,右侧的第一分量P(F(x,y))根据其输入亮度水平给出每个像素的基本色调映射水平。另一方面,第二分量q(f(x,y),fave(x,y))给出局部对比度增强,并且可以描述如下。

(7)q(f(x,y),fave(x,y))=(f(x,y)fave(x,y))1f(x,y)p(f(x,y))dp(f(x,y))df(x,y)

当输入亮度水平f(x,y)等于其局部平均值fave(x,y)时,(6)中的输出亮度水平g(x,y)正好映射到基本色调映射曲线p(f(x,y))上。该基本色调映射曲线p(f(x,y))可以针对不同目的任意确定,因此该算法非常灵活。一旦给出了基本色调映射曲线,第二分量q(f(x,y),fave(x,y))自动增强每个亮度级处的局部对比度,以将其保持为与原始的对比度一样。更具体地,输入亮度f(x,y)与局部平均值fave(x,y)的比率在处理前后保持一致。
此外,我们修改(3)如下。

(8)G(x,y)=P(F(x,y))+α{1dP(F(x,y))dF(x,y)}(F(x,y)Fave(x,y))

在亮度域中,该等式也被重写为以下等式。

(9)g(x,y)=p(f(x,y))×r(f(x,y),fave(x,y))

(10)r(f(x,y),fave(x,y))=(f(x,y)fave(x,y))α{1f(x,y)p(f(x,y))dp(f(x,y))df(x,y)}

在这些等式中,$\alpha \alpha $被设置为1.0时,等式(9)(10)分别等同于等式(6)(7),并且变换图像的局部对比度被保持为与原始图像的局部对比度一样多。另一方面,对于α<1.0 ,局部对比度增强较弱,$\alpha>1.0 \alpha f(x,y)f_{ave}(x,y)$的函数。

(9)(10)中的局部平均f(x,y)通过如下进行空间平均滤波器A(x,y)和输入图像f(x,y)的卷积来计算,

(11)fave(x,y)=A(x,y)f(x,y)

在我们的基本模型中,以高斯滤波器作为空间平均滤波器,公式如下。

(12)A(x,y)=Kexp{(x2+y2)/σ2}

在该等式中,K是用于归一化滤波器系数的增益因子,

(13)A(x,y)dxdy=1

此外,$\sigma M±2\sigma \sigma M=4\sigma +1$应该是足够的。

III.LCRT在数字视频中的应用

数码摄像机要求满足的条件是动态范围压缩,阴影到中间亮度范围、包括主对象不会降低。为此会采用拐点曲线作为动态范围压缩函数,但是难以同时保持高亮区域的对比度。针对这一问题,本文提出了一种基于LCRT的动态范围压缩算法。本节详细介绍了确定数字摄像机和整个系统的基本色调映射曲线的实用方法。

A.数码摄像机的基本色调映射曲线

通常,将传统的拐点曲线应用于由相机伽马处理的图像。因此,在本节中,我们将处理亮度由相机伽马处理的域中的色调再现,我们称之为相机伽马域。

如前一章所述,一旦确定了(9)中的任何基本色调映射曲线,我们就可以将LCRT应用于色调映射曲线,并在保持局部图像对比度的情况下实现动态范围压缩功能。为了保持阴影到中间亮度范围,优选地选择传统的拐点曲线作为基本色调映射曲线。然而,传统的拐点曲线在拐点处的一阶微分系数具有不连续性。如(10)所示,为了保持由LCRT处理的结果图像的连续性,基本色调映射曲线中的信号电平和一阶微分系数必须是连续的。

为了满足这个条件,我们提出了近似使用三次曲线的拐点曲线如下(见图3)。

无法显示图片

图3 近似拐点曲线

(14)if(fc(x,y)<tc)pc(fc(x,y))=fc(x,y)elsepc(fc(x,y))=afc(x,y)3+bfc(x,y)2+cfc(x,y)+d

在该等式中,后缀“c”表示相机伽马域中的值。因此,fc(x,y)pc(fc(x,y))表示相机伽马域中的基本色调映射曲线的输入亮度和输出亮度。然后,tc表示在同一域中将曲线从线性切换到三次的阈值。为了确定它们的系数,我们施加的条件,在阈值电平和最大输入电平的合成亮度和一阶微分系数应该等于那些传统的拐点函数曲线。该约束描述如下,

(15)pc(tc)=atc3+btc2+ctc+d=tc

(16)pc(tc)=3atc2+2btc+c=1

(17)pc(mc)=amc3+bmc2+cmc+d=1

(18)pc(mc)=3amc2+2bmc+c=sc

其中,mc表示最大输入电平,sc表示最大输入电平处的传统拐点曲线的微分系数,描述为

(19)sc=1kctckc

其中,kc表示在传统拐点曲线的拐点处的亮度级。通过求解(15)(18),计算得到如下三次曲线的系数a,b,c,d

(20)a=(sc1)tc+(2mcmcsc)(tcmc)3

(21)b=2(1sc)tc2+(mcsc+2mc3)(tc+mc)(tcmc)3

(22)c=sctc3+(sc4)mctc2+(6mc2mcsc)mctcmc3(tmc)3

(23)d=(1mcsc)tc3+(mcsc+2mc3)mctc2(tcmc)3

图4显示了与传统拐点曲线近似的色调映射曲线。在该图中,示出了mc=2.0,kc=0.9的常规拐点曲线。此外,还示出了tc=0.15,0.25,0.35,0.45,0.55,0.65时的六种近似拐点曲线。如图4所示,在阈值电平和最大输入电平下,近似拐点曲线与传统拐点曲线平滑连接。此外,它表明,阈值越接近拐点,阴影到中间亮度的范围转换越接近传统的拐点曲线。然而,如果阈值电平设置得太大,例如t>0.35,则近似拐点曲线超过传统拐点曲线。当它具有比常规拐点曲线大的输出时,即使应用LCRT,也变得难以再现具有高对比度的高亮区域。 因此,我们应该通过实验选择最大阈值,而不会过冲。

无法显示图片

图4 传统和近似拐点曲线

B.LCRT在拐点曲线拟合中的应用

等式(14)表示相机伽马域中的输入亮度和输出亮度之间的关系。这些方程在亮度域中变换如下,

(24)if(f(x,y)<t)p(f(x,y))=f(x,y)elsep(f(x,y))={af(x,y)3+bf(x,y)2+cf(x,y)+d}γ

其中,γ表示照相机γ,并且a,b,c,d(20)(23)给出。此外,t表示阈值,由$t=t_c^\gamma (24)$的微分函数描述如下。

(25)if(f(x,y)<t)dp(f(x,y))df(x,y)=1elsedp(f(x,y))df(x,y)=γ×{af(x,y)3+bf(x,y)2+cf(x,y)+d}γ1×{3af(x,y)2+2bf(x,y)+c}

一旦确定了近似拐点曲线,就可以通过用(24)(25)代替(9)(10)来对其应用LCRT过程。这是我们提出的数字摄像机动态范围压缩算法。

无法显示图片

图5 LCRT处理的近似拐点曲线

图5示出了LCRT处理的近似拐点曲线和色调映射曲线。在这种情况下,参数分别设置为γ=2.2,m=2.0γ,k=0.9γ,t=0.35γ,α=1.0。该图说明了f(x,y)=0.11.010种情况下曲线的变化。如该图所示,由于亮度范围没有被近似拐点曲线压缩,所以阈值水平下的局部对比度没有被LCRT增强。另一方面,超过阈值的色调范围根据三次曲线被压缩,因此局部对比度被增强以保持与原始对比度相同。因此,在该范围内,取决于局部平均值的不同,不同的色调映射曲线被应用于不同像素。然而,当输入亮度大于局部平均值时,该过程倾向于导致饱和亮度,因为拐点以上的输出色调范围不够宽。所以在这种情况下应当将增益参数α设置小于1.0。这里,为了补偿视觉对比度的劣化,当输入亮度小于局部平均值时,通过将增益参数α设置大于1.0来放大局部对比度增益。
无法显示图片

图6 应用不同 α 色调映射曲线

图6示出了如下确定α的情况下的色调映射曲线, (26)if(f(x,y)>fave(x,y))α=0.25elseα=1.75 从图中可以看出,通过该调整,亮度几乎不饱和。

另外,应当注意,输出亮度没有色调跳跃,因为近似拐点曲线保证了在任何亮度水平下输出水平和一阶微分系数两者的连续性。

C.系统

图7总结了所提出的算法。我们的算法在亮度域操作,同最传统的动态范围压缩方法一致。因此,首先将捕获的RGB图像变换为亮度分量Y。接下来,通过将近似拐点曲线应用于亮度分量Y来计算基本色调映射图像FT。同时,使用例如高斯滤波器的空间平均滤波器卷积到亮度分量Y以计算得到像素周围的局部平均LA。根据(10),计算局部对比度增益CG以保持与原始的局部对比度一样多的局部对比度。然后,将基本色调映射图像FT乘以局部对比度增益CG,我们得到LDR亮度分量LD。最后,通过LDR亮度分量LD与输入亮度分量Y的比率来修改捕获图像的RGB通道,计算得到的RGB图像。

无法显示图片

图7 本文算法完整系统

IV.实验结果

我们测试了我们提出的算法的性能。在这个实验中,我们使用的数码相机富士Finepix F710,以捕捉高动态范围的图像。这款相机有两个传感器,S(敏感)和R(范围)传感器,彼此相邻。S传感器就像普通传感器一样,R传感器灵敏度较低,并扩展了捕捉照片明暗的能力。首先,我们校准了这两个传感器。然后,我们将S和R传感器捕获的图像进行合成,以获得HDR图像用于我们的实验。最后,我们将我们提出的算法应用于HDR图像,并评估了性能。

A.校准

首先,对S和R传感器的灵敏度进行标定。在这个实验中,我们捕获了投影在屏幕上的测试图案,并比较了由两个传感器获得的图像,我们分别称之为“S图像”和“R图像”。图8示出了由S传感器捕获的图像。

无法显示图片

图8 S传感器拍摄图像

无法显示图片

图9 S和R传感器拍摄图像的关系

然后我们计算每个补丁的平均亮度,并绘制“S图像”和“R图像”的相应亮度之间的关系,如图9所示。该图说明两个传感器的灵敏度具有由以下线性方程近似的比例关系,

(27)S(x,y)=17.399×R(x,y)

其中S(x,y)R(x,y)分别表示“S图像”和“R图像”中的像素级。因此,我们合成具有如下混合比率的图像,

(28)if(S(x,y)<th0)f(x,y)=S(x,y)elseif(S(x,y)<thr1)f(x,y)=thr1S(x,y)thr1thr0×S(x,y)+S(x,y)thr0thr1thr0×1.7399×R(x,y)elsef(x,y)=17.399×R(x,y)

其中,th0th1表示用于构成“S图像”和“R图像”的阈值。“S图像”和“R图像”的混合比如图10所示。

无法显示图片

图10 S和R传感器拍摄图像混合比例

在下面的实验中,我们设置th0=0.8th1=0.9来合成HDR图像。
此外,我们设置HDR图像f(x,y)的上限。一般来说,没有多量程传感器的普通数码摄像机无法拍摄像Finepix F710这样的HDR图像。因此,我们将所计算的HDR图像亮度f(x,y)裁剪为输出LDR图像亮度g(x,y)4.6倍高,这导致m=2.0γ

B.实验结果对比

我们对许多测试图像进行了实验。在这个实验中,我们设置了如图6所示的相同参数。图11、图12和图13中示出了一些结果。每个图中的顶部、中部和底部行分别说明了全输入范围、近似拐点曲线和所提出算法的线性压缩处理结果。

无法显示图片 无法显示图片 无法显示图片

图11-13 实验结果

如图清楚地示出的,线性范围压缩(顶行)非常好地保持了高光对比度,但是再现了如在面部区域中看到的阴影中的中等范围亮度。因此,这些不是好的结果,因为拍摄图像中的主要对象没有被清楚地再现,并且没有充分反映摄影者的意图。相反,近似拐点曲线(中间行)清楚地再现阴影到中间范围亮度,使得它们在这方面优于顶部行。然而,例如,在图11(B)中的窗口外部、图12(B)中的蓝天和白色、或图13(B)中的显示面板中,这些结果中的高光对比度严重降低。这些结果与直接观察到的现象有很大的不同。

而另一方面,在我们提出的算法的结果(底部行)中,高亮对比度高度保持,同时清晰地再现阴影到中间范围亮度。这些都与直接观察有密切的关系。

V.结论和将来的工作

本文提出了一种新的数字摄像机动态范围压缩方法。该算法与传统的空间变化方法一样,基于视觉对比度依赖于局部图像对比度的假设。该方法还具有满足数字摄像机不将阴影变为中间范围外观的要求的特点。

首先,我们提出了一种新的算子LCRT,它根据基本色调映射曲线自动自适应地增强局部图像对比度,并在任何亮度水平下保持与原始图像相同的局部对比度。其次,我们定义了一个近似的拐点曲线,保证在任何亮度水平的输出电平和一阶微分系数的连续性,保持功能接近传统的拐点曲线。然后,我们所提出的算法的动态范围压缩制定应用LCRT的近似拐点曲线。

实验结果证明了该算法的性能。这些结果表明,该算法保留了亮区的局部对比度,如天空区域或通过窗口看到的外部场景,而不会降低阴影到中间范围亮度,包括主要对象,如面部区域。

该算法有许多参数,但大多数参数是根据给定的基本色调映射曲线自动确定的。因此,我们只需要实验确定几个参数。

将该方法应用于数字摄像机的动态范围压缩,可以轻松再现任何亮度水平下的高对比度的真实图像。然而,目前所提出的算法需要很高的计算成本与大量的内存。算法的更有效的实现留给我们未来的工作。

附录

在本附录中,我们从(3)导出(6)(7)。如上所述,F(x,y)、F(x,y)、G(x,y)和G(x,y)分别表示f(x,y)、f(x,y)、g(x,y)和g(x,y)的对数值。这些关系描述如下。

(A1)F(x,y)=log{f(x,y)}Fave(x,y)=log{fave(x,y)}G(x,y)=log{g(x,y)}Gave(x,y)=log{gave(x,y)}

此外,P(F(x,y)) 表示p(f(x,y))的双对数方程。其描述如下。

(A2)P(F(x,y))=log(p(f(x,y)))

通过将(A1)(A2)代入相应的项,等式(3)可以重写如下。

(A3)log{g(x,y)}=log{p(f(x,y))}+{1dP(F(x,y))dF(x,y)}{log{f(x,y)}log{fave(x,y)}}=log{p(f(x,y))}+log{(f(x,y)fave(x,y)){1dP(F(x,y))dF(x,y)}}=log{p(f(x,y))(f(x,y)fave(x,y)){1dP(F(x,y))dF(x,y)}}

等式(A3)导致以下等式。

(A4)g(x,y)=p(f(x,y))(f(x,y)fave(x,y)){1dP(F(x,y))dF(x,y)}

这里,双对数域中的基本色调映射曲线的导数可以如下变换到亮度域。

(A5)dP(F(x,y))dF(x,y)=d{log{p(f(x,y))}}d{log{f(x,y)}}={d{log{p(f(x,y))}}df(x,y)}/{d{log{f(x,y)}}df(x,y)}={d{log{p(f(x,y))}}dp{f(x,y)}}{dp{f(x,y)}df(x,y)}/{d{log{f(x,y)}}df(x,y)}={1dp{f(x,y)}}{dp{f(x,y)}df(x,y)}/{1f(x,y)}=f(x,y)p(f(x,y))dp(f(x,y))df(x,y)

因此,通过用(A5)代替(A4)来导出等式(6)

posted @   董呼哈  阅读(52)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 被坑几百块钱后,我竟然真的恢复了删除的微信聊天记录!
· 没有Manus邀请码?试试免邀请码的MGX或者开源的OpenManus吧
· 【自荐】一款简洁、开源的在线白板工具 Drawnix
· 园子的第一款AI主题卫衣上架——"HELLO! HOW CAN I ASSIST YOU TODAY
· Docker 太简单,K8s 太复杂?w7panel 让容器管理更轻松!
点击右上角即可分享
微信分享提示