[读书笔记/翻译]Multiple View Geometry in Computer Vision-1.4,1.5,1.6
1.4 Three-view geometry
对于两个视点,基本的代数项是基础矩阵,而对于三视点,规则是trifocal tensor(不晓得专业翻译是什么)。它是一个3*3*3的数组,代表对应的点或线在三视点下的坐标。正如同基础矩阵是由两个镜头矩阵定义的,trifocal tensor是由3个镜头矩阵定义,之间的对应关系也与2视点相同,同样取决于投影转换。
trifocal tensor的格式是,有两个上标一个下标。
考虑图像中的一个点x,和另外两幅图像中的线l'和l'',表示空间中的点X映射到图像1中的x,以及在另外两幅图中线l'和l''上的x'和x''。于是得到
我们可以任意地选择经过点x'和x''的线,从而生成足够的线性方程组。同样的,7个点足够线性的求解,而最小可以由6个点用非线性方法求解。
trifocal tensor的27个项遵循一种很复杂的内部约束,而基础矩阵的内部约束则简单的多:F=0。
使用3视点重建的优点如下:
- 可以通过一系列点和线的对应关系来进行投影重建。2视点只能使用点的对应关系。
- 使用3视点会大大加强重建的稳定性,避免了2视点可能带来的不稳定格局。
1.5 Four view geometry and n-view reconstruction
4视点重建一般不采用quadrifocal tensor的方法,因为内部约束过于复杂。多视点的重建考虑过许多方法,比如划分开来用2视点或3视点重建。如果我们可以采用仿射镜头,重建的任务会简单许多。只要场景前后的深度远小于镜头到到场景的距离,镜头模型就是透视投影的近似。于是可以采用一个经典算法factorization algorithm来计算场景结构,而指定的镜头模型使用Singular Value Decomposition。这个算法要求所有点在所有视图中可见。
一般重建问题的主要方法是bundle adjustment,这是一种迭代方法,使非线性模型与测量数据相对应。优点是最具一般性,用于广泛的重建和优化问题中。但由于是迭代方法,对于任意的初始点,不保证收敛得到最优解,需要一个初始化。
注:本节讲了一些方法,我并没有全部翻译,只是挑了几个主要部分。
1.6 Transfer
投影几何的另一个应用是转换:给定一个视点的点,得出它在其他视点的位置。方法就是:
还有一种方法是直接根据3视点丈量来转换,无需显式地重建。两种方法各有优劣。
假设镜头沿中心旋转,或者所有的场景点位于一个平面。则多视点关系近似看做图像间的共面投影转换。在这种情况下,可以从一个图像中的点直接转换到其他图像。
本文原创, 转载请注明出处