3D 视觉之刚体变换

1 投影空间

　欧氏空间，主要描述角度和形状，针对的是理想几何物体。例如，两条 ∥ 线永不相交，或交于无穷远点 (虚拟的点)。中学时代的 “平面与立体几何”，便属于欧式空间。

　投影空间，指实际物体，被相机拍摄后，成像所在的空间，常用于计算机视觉中。在投影空间里，两条直线必会相交于一点，只不过当这两条线平行时，交点为无穷远。

　如图所示，现实中的两条铁轨，成像在投影空间时，相交于某一点，也即无穷远点；但在欧氏空间中，无穷远点是理想点，并没有实际意义。

　这样，就需要一种新的表示方法 -- 齐次坐标，将欧氏空间的无穷远点，与投影空间中有实际意义的点，建立起映射关系。

2 齐次坐标

　在平面几何里，采用笛卡尔坐标，则一个点可表示为 $(x, y)^{T}$。如果增加一个坐标值，表示为 $(x, y, 1)^{T}$，且约定 ($x, y, 1)^{T}$ 和 $(kx, ky, k)^{T}$ 表示的是同一个点 (其中 k ≠ 0)，

则这种用一个 N+1 维的向量，来表示 N 维向量的方法，称为齐次坐标法。

　这样，由齐次坐标 $(x, y, w)$，可推导出笛卡尔坐标 $ (\dfrac{x}{w}, \dfrac{y}{w})$

2.1 无穷远点

欧式空间中，两条平行线方程组，如下：

　$\begin{cases} AX + BY + C = 0 \\ AX + BY + D = 0 \end{cases} $ ，其中 C ≠ D

　齐次坐标点$(x, y, w)^{T}$ 与欧氏空间点 $(X, Y)^{T}$ 的对应关系为： $ X = \dfrac{x}{w}, Y = \dfrac{y}{w}$，代入上面方程组得：

　$\begin{cases} A\dfrac{x}{w} + B\dfrac{y}{w} + C = 0 \\ A\dfrac{x}{w} + B\dfrac{y}{w} + D = 0 \end{cases} $ => $\begin{cases} Ax+ By + Cw = 0 \\ Ax+ By + Dw = 0 \end{cases} $ => $w = 0$

　既然 w = 0，则齐次坐标为 $(x, y, 0)^{T}$，对应笛卡尔坐标 $(\dfrac{x}{0}, \dfrac{y}{0})^{T}$，表示的是无穷远点 $(∞, ∞)^{T}$

2.2 合并加法

　点 $(x, y, z)^{T}$，经过伸缩和平移后，成为点 $ (x', y', z')^{T} = (r_{1}x+t_{1}, r_{2}y+t_{2}, r_{3}z+t_{3})^{T}$，该变换过程可用如下公式表示：

　$\begin{bmatrix} x' \\ y' \\ z' \end{bmatrix} = \begin{bmatrix} r_{1} & 0 & 0 \\ 0 & r_{2} & 0 \\ 0 & 0 &r_{3} \end{bmatrix} \begin{bmatrix} x \\ y \\ z \end{bmatrix} + \begin{bmatrix} t_{1} \\ t_{2} \\ t_{3} \end{bmatrix} $

　如果使用齐次坐标，则可将平移变换，转化为矩阵乘法，消除了上式中的矩阵加法

　$\begin{bmatrix} x' \\ y' \\ z' \\1 \end{bmatrix} = \begin{bmatrix} r_{1} & 0 & 0 & t_{1} \\ 0 & r_{2} & 0 & t_{2} \\ 0 & 0 & r_{3} & t_{3} \\ 0 & 0 & 0 & 1 \end{bmatrix} \begin{bmatrix} x \\ y \\ z \\ 1\end{bmatrix} $

2.3 向量和点

齐次坐标还可以区分向量和点，具体如何区分的，尚待研究 ... ...

3 刚体变换

3.1 刚体定义

　欧氏空间中，当物体被视为刚体时，不管是该物体的位置或朝向发生变化，还是更换观察的坐标系，其大小和形状都保持不变。

形象点说，猪八戒的九齿钉耙，由冰铁铸造而成，便是一种刚体；而镇元子大仙的七星鞭，由于是龙皮做的，故为非刚体。

3.2 位置和朝向

　所谓刚体变换，就是一个可被看做刚体的物体，从一个状态 (位置和朝向)，转换为另一个状态的过程。

　如上所示，从世界坐标系到相机坐标系的转换，朝向由旋转矩阵 $R$ 表示，位置则由平移矩阵 $T$ 来表示： $ P_{c} = R \cdot P_{w} + T$

　其中，旋转矩阵 $ R = \begin{bmatrix} r_{11} & r_{12} & r_{13} \\ r_{21} & r_{22} & r_{23} \\ r_{31} & r_{32} & r_{33} \end{bmatrix} $，平移矩阵 $ T = \begin{bmatrix} t_{1} \\ t_{2} \\ t_{3} \end{bmatrix} $

　旋转矩阵 R 为正交矩阵 (也即，RR' = E，E 为单位矩阵)，则满足以下 6 个约束条件

　(1) 大小约束 $\begin{cases} r_{11}^2 + r_{12}^2 + r_{13}^2 = 1 \\ r_{21}^2 + r_{22}^2 + r_{23}^2 = 1 \\ r_{31}^2 + r_{32}^2 + r_{33}^2 = 1\end{cases} $ (2) 方向约束 $\begin{cases} r_{11}*r_{21} + r_{12}*r_{22} + r_{13}*r_{23} = 0 \\ r_{21}*r_{31} + r_{22}*r_{32} + r_{23}*r_{33} = 0 \\ r_{31}*r_{11} + r_{32}*r_{12} + r_{33}*r_{13} = 0\end{cases} $

可用一个最简单的正交矩阵 E，来理解上面的约束条件

$\begin{bmatrix} 1 & 0 & 0 \\ 0 & 1 & 0 \\ 0 & 0 & 1 \end{bmatrix}$

3.3 转换关系

若已知 $R$ 和 $T$，则可将世界坐标系内的空间点，与相机坐标系内的空间点，建立起一一对应的关系

　$ \begin{bmatrix} X_{c} \\ Y_{c} \\ Z_{c} \end{bmatrix} = \begin{bmatrix} R & T \end{bmatrix} \begin{bmatrix} X_{w} \\ Y_{w} \\ Z_{w} \end{bmatrix}$

3.3.1 约束分析

$R$ 和 $T$ 共有 12 个未知量，减去正交约束的 6 个方程，则还剩 6 个未知量。

表面上看，似乎只需 2 组共轭点，就可得到 6 个约束方程，对应求出剩余的 6 个未知量。实际上，这 6 个方程是有冗余信息的 (两组共轭点，在各自的坐标系下，两点之间的距离相等)

因此，第 2 组共轭点，只是提供了 2 个约束方程，加上第 1 组共轭点的 3 个约束，共有 5 个独立的约束方程。

显然，还需要第 3 组共轭点，提供 1 个独立的方程，才能求得 $R$ 和 $T$

3.3.2 几何解释

如下图所示，考虑两个刚体，它们之间存在着相互旋转和平移

首先，在每个刚体上，各选一个点 L1 和 R1，移动其中一个刚体，使得这两个点重合。此时，一个刚体可相对于另一个刚体转动 (以三种不同的方式)。

然后，在每个刚体上，再分别取一个点 L2 和 R2，并且 | L2 - L1 | = | R2 - R1 |，移动一个刚体，使得这两对点，分别重合。此时，一个刚体可以相对另一个转动 (以一种方式)。

最后，在每个刚体上，分别取第三个点 L3 和 R3，满足 | L3 - L1 | = | R3 - R1 | 且 | L3 - L2 | = | R3 - R2 |，然后将这三个点对齐。此时，两个刚体便牢牢的连在了一起。

参考资料

<视觉测量> 张广军，第2章

<Robot Vision> Chapter 13

<An Invitation to 3D Vision> Chapter 2

Homogeneous Coordinates

posted on 2017-09-28 18:10 飞鸢逐浪阅读(8498) 评论(7) 收藏举报

刷新页面返回顶部

3D 视觉 之 刚体变换