稀疏光流特征点跟踪(KLT)
稀疏光流原理
光流(optical flow)是空间运动物体在观测成像面上的像素运动的瞬时速度。物体在运动的时候,它在图像上对应点的亮度模式也在做相应的运动,这种图像亮度模式的表观运动就是光流。它的基本假设是体素和图像像素守恒,即一个物体的颜色在前后两帧没有巨大而明显的变化。不同的光流算法解决了假定了不同附加条件的光流问题。根据所形成的光流场中二维矢量的疏密程度可以分为稠密光流与稀疏光流两种。
稠密光流是一种针对图像或指定的某一片区域进行逐点匹配的图像配准方法,它计算图像上所有的点的偏移量,从而形成一个稠密的光流场。通过这个稠密的光流场,可以进行像素级别的图像配准。
稀疏光流并不对图像的每个像素点进行逐点计算。它通常需要指定一组点进行跟踪,这组点最好具有某种明显的特性,例如Harris角点等,那么跟踪就会相对稳定和可靠。稀疏跟踪的计算开销比稠密跟踪小得多,计算更便捷,其建立在下面三个假设上:
-
亮度恒定。\(I(x, y, t-1) = I(x+u(x,y), y+v(x,y), t)\),即运动物体在图片上的灰度值在很短的时间内不会改变;
-
时间连续或者是运动是“小运动”;
-
空间一致,临近点有相似运动,保持相邻,即同一个窗口中的点偏移量都相等。
将\(I(x, y , t-1) \approx I(x, y, t) + I_x u(x,y)+I_y (x, y)\)做一阶泰勒展开,得到
上式中存在两个变量\(u(x, y)\)和\(v(x, y)\),再利用假设三,即空间一致性,如果选择的窗口大小是5,那么就可以得到25个等式,即
令
可以看出,上述问题是一个最小二乘问题\(Ad = b\),即\(A^TAd = A^Tb\)。当\(A^T A\)可逆式,且不稀疏,\(A^T A\)的条件数比较合适时求解速度更快。
\(A^T A\)的特征根和特征值与边的方向和幅度有关,当\(A^T A\)两个特征值都比较大时,说明该点在\(x\)和\(y\)方向上变换都比较大,更可能是角点;当两个特征值都比较小时,说明该点更可能在“平滑”的区域。因此只有当该点是角点的时候,上述方程才能解。
Lucas-Kanade flow
Lucas-Kanade flow极小化下面式子得到\((u,v)\):
其中
其中的权重\(w\)一般使用高斯核,则通过\(\frac{\partial E(u, v)}{\partial (u, v)}=0\)可以得到
光流法用于目标跟踪的原理为:
-
针对每一个视频序列,利用一定的目标检测方法,检测可能出现的前景目标
-
如果某一帧出现了前景目标,找到其具有代表性的关键特征点(可以随机 产生,也可以利用角点来做特征点)
-
对之后的任意两个相邻视频帧而言,寻找上一帧中出现的关键特征点在当 前帧中的最佳位置,从而得到前景目标在当前帧中的位置坐标
-
如此迭代进行,便可实现目标的跟踪
Lucas-Kanade光流法可能会面临下述问题:
-
物体运动幅度较大,大于一个像素。解决方法是Iterative refinement,coarse-to-fine estimation;
-
像素点和它周围点的运动不相似,可以通过动作分割来解决;
-
违背亮度值一致假设。
多尺度迭代光流估计
上面说到当物体运动超过一个像素时,Lucas-Kanade光流法可能会遇到问题。时间混淆就是一个例子,
图像有多个亮度点匹配,如果选择临近点则会对动作造成错误估计。多尺度能解决这个问题。首先,对每一帧建立一个高斯金字塔,最大尺度图片在最顶层,原始图片在底层。然后,从顶层开始估计下一帧所在位置,作为下一层的初始位置,沿着金字塔向下搜索,重复估计动作,直到到达金字塔的底层。其算法流程如下: