从单幅图像高质量去除运动模糊——读JiaYaJia同名英文论文总结
原始论文在这里 http://www.cse.cuhk.edu.hk/leojia/projects/motion_deblurring/
一、概述
论文根据以下的基本模糊图像模型建立
其中I是我们观测到的图像,L是真实的图像,f是运动模糊的卷积核,n是观测过程中叠加的噪声
然后从统计角度分析L,f,n服从的分布,从而作为先验,构造能量函数进行优化求解。
二、对已有图像统计得到先验
1.L统计
1)对多幅图像统计的结果,L的梯度在全局上满足如下分布(曲线已经对数化)
曲线拟合表示为
最终的全局先验
2)构造L的局部先验来抑制振铃现象
使用一个与模糊核相同大小的窗口覆盖图像,计算偏差sd,输出图像 = sd<5?1:0,
将全局和局部先验组合起来
2.f统计
通过对模糊核的统计,f的直方图符合指数分布,即大部分像素是0附近的
3.n一般的表述为
统计表明噪声一般服从高斯分布,或者乘高斯分布
其中表示标准差,在Simon 2002论文中证明,递推出。
三、如何进行优化?
由贝叶斯原理
构造能量函数,得到
上式中表示矩阵元素乘法,几个参数
实验中,初始化,前面有,从而得到。
下面对(5)式进行分步优化
1.先优化L,将f去掉,(5)式可简化成
用代替,上式再简化成
最后带的余项表示的近似。(8)式是关于和的式子(当然还有I,这里先忽略),下面分开进行优化
1) 固定的话,(8)式进一步简化成
上式可以看出关于x和y的组合x和y等价,对每个具体的可写成,从而
这是一个关于的优化函数,最小化它就能得到一个最小的,即最小的x和y。
实验过程中,在迭代开始时分别设置在0.002-0.5 和 10-25之间,每次迭代后分别除以k1和k2,k1取值范围为[1.1, 1.4],k2= 1.5。
2) 更新了之后,我们固定可以将(8)式简化成
这个式子怎么求解呢?麻烦在于有卷积。进而考虑傅里叶变换到频域进行处理,得到
时域和频域对应,从而相当于求
这个优化在Gamelin .2003的文献里有求解原理说明,得到
其中的,这里和还是对原L的导数吗?有点疑问。
重复交替迭代优化和直到收敛。实验过程中最初设为2,迭代一次乘以2。最后得到的最优值。
2.第二步就是优化模糊核了,固定则(5)式可简化为
这是关于的二次函数,类似于Jia 2007和Levin 2007写的样子,抽象如下
其中A和B是分别受L和I影响的矩阵,标准形式在Kim 2007的论文中提出,求解的基本思想是利用对偶原理,使用内点法求解。
至此,和的最优化估计就已经得出,算法框架如下
参考文献
[1] GAMELIN, T. W. 2003. Complex Analysis. Springer.
[2] JIA, J. 2007. Single image motion deblurring using transparency.In CVPR.
[3] LEVIN, A., FERGUS, R., DURAND, F., AND FREEMAN, B. 2007.Image and depth from a conventional camera
with a coded aperture.In SIGGRAPH.
[4] KIM, S.-J., KOH, K., LUSTIG, M., AND BOYD, S. 2007. Anefcient method for compressed sensing. In ICIP.
[5] SIMON, M. K. 2002. Probability Distributions Involving GaussianRandom Variables: A Handbook for Engineers,
Scientists and Mathematicians. Springer.