一种亚像素配准方法的过程推导(Keren,1988)
原文:Image Sequence Enhancement Using Sub-pixel Displacements
这里做一下原文中亚像素配准计算过程的细化推导,对结果对比部分暂时不做展示。
目的是解释MLTP(互局部三值模式)配准中对位移及旋转角度的求解公式。
1、原理(假设)
我们将图像帧视为两个函数 f 和 g 的关系,水平方向位移为a,垂直方向位移为b,旋转角度为θ,满足如下关系:
如果我们将sin(θ)和cos(θ)按泰勒展开取到二阶项:
(2-1)泰勒展开公式,由此可得(2-2)和(3)的二阶近似,代入1中会得到(4):
将 f 近似为其泰勒展开的第一项,式(5)为二元函数 f(x,y) 的一阶泰勒展开,由此可得(4)式的泰勒展开近似结果(6):
2、求解a、b、θ的值
函数 g 和旋转、平移后的函数 f 间的误差可由下式近似表示:
对(7)式整理,并忽略二阶无穷小项:
如果我们通过计算三个参数的偏导数等于0来寻求误差 E 的最小化,那么忽略非线性项和高阶(忽略二阶及以上,7-2式)小项后,我们得到如下的线性方程系统,并对重叠区域求和,其中 R 是缩写形式,见式(8)。对a、b、θ分别求偏导数如下(9、10、11):
由式(9)、(10)、(11)可得矩阵运算形式(12):
(12)式用简化式表示为(13),通过求逆矩阵Φ-1的方式便可位移和旋转角度a、b、θ。
到此,推导完毕,进一步配准的过程后面再补充。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)