一. 奇异值分解在3D视觉中的应用

ICP问题的应用

ICP (Iterative Closest Point)迭代最近点在点云配准、手眼标定当中都有应用。

比如在点云配准中，两帧点云有n对对应的点，如何寻找欧式变换将这两组点重合，这就是ICP在点云配准中的应用。

再比如3D相机和机械臂的手眼标定，获得多个点在相机坐标系中的坐标Pc以及在机械臂坐标系中的坐标PB，然后将Pb和PC配准重合，就得到了相机坐标系和机械臂坐标系的欧式变换。

矩阵的奇异值分解 (SVD)

令矩阵 $A \in R^{m \times n}$ ，存在两个正交矩阵（复数域则是酉矩阵） $U \in R^{m \times m}$ 和 $V \in R^{n \times n}$ ，使得

A_{m \times n} = U_{m} Σ_{m \times n} V_{n}^{T}

式中， $Σ = [\begin{matrix} Σ_{1} & 0 \\ 0 & 0 \end{matrix}], Σ_{1} = diag (σ_{1}, \dots, σ_{r})$ 为r阶方阵， $σ_{i}$ 为A的奇异值，且按大小降序排列， $r = rank (A)$ 。

‍

SVD求解迭代最近点 (ICP)

如下图1所示，有两个三维点的集合A和B，集合A中的点 $p_{i}$ 和集合B中的点 $p_{i}^{'}$ 一一对应。

ICP问题就是寻找欧式变换 R, t，使得 $p_{i} = R p_{i}^{'} + t$ 。即寻找一个欧式变换使得点集B经过此变换与点集A重合，如图2所示。

如果这里点集A是一帧点云，B是下一帧点云，那么ICP就是如何对这两帧点云进行配准。

如果这里点集A是相机坐标系中的点，点集B是在机械臂基坐标系下的点，那么这里ICP就是求解手眼标定问题。

这里的推导过程参考了 K. S. ARUN, T. S. HUANG, AND S. D. BLOSTEIN. Least-Squares Fitting of Two 3-D Point Sets，省略了一些证明的部分，感兴趣的读者可以看看这篇文章。

构建最小二乘问题，我们的目标就是求解R, t使得下式最小二乘误差最小

min_{R, t} \frac{1}{2} \sum_{i}^{n} | | p_{i} - (R p_{i}^{'} + t) | |_{2}^{2}

我们使用每个点集的去质心坐标带入上面的最小二乘误差中，令A的质心为 $\bar{p} = \frac{1}{n} \sum_{i = 1}^{n} p_{i}$ ，A中每个点的去质心坐标表示为 $q_{i} = p_{i} - \bar{p}$ ，类似的，定义B的质心为 ${\bar{p}}^{'} = \frac{1}{n} \sum_{i = 1}^{n} p_{i}^{'}$ ，B中每个点的去质心坐标为 $q_{i}^{'} = p_{i}^{'} - {\bar{p}}^{'}$ 。

将去质心坐标带入误差 $J = \sum_{i}^{n} | | p_{i} - (R p_{i}^{'} + t) | |^{2}$ ，（这里我省略了二范数的下标），得到

J = \sum_{i}^{n} | | q_{i} + \bar{p} - [R (q_{i}^{'} + {\bar{p}}^{'}) + t] | |^{2} = \sum_{i}^{n} | | q_{i} - R q_{i}^{'} + \bar{p} - (R {\bar{p}}^{'} + t) | |^{2}

我们观察上式中，前面的部分 $(q_{i} - R q_{i}^{'})$ 是点集A和旋转后的点集B的去质心坐标之差，表示了姿态的误差，后面的项 $\bar{p} - (R {\bar{p}}^{'} + t)$ 是点集A的质心和点集B质心的误差。而最小二乘法得到的 R, t 是保证两个点集的质心重合的，因此 $\bar{p} - (R {\bar{p}}^{'} + t) = 0$ ，误差变为(省略 $\sum$ 上下标)

J = \sum | | q_{i} - R q_{i}^{'} | |^{2} = \sum (q_{i} - R q_{i}^{'})^{T} (q_{i} - R q_{i}^{'}) = \sum (q_{i}^{T} q_{i} - q_{i}^{T} R q_{i}^{'} - q_{i}^{' T} R^{T} q_{i} + q_{i}^{' T} R^{T} R q_{i}^{'})

上式中， $q_{i}^{T} R q_{i}^{'}$ 和 $q_{i}^{' T} R^{T} q_{i}$ 两项都是标量，可以合并；第四项中的 $R^{T} R = I$ ，于是上式简化为

J = \sum (q_{i}^{T} q_{i} + q_{i}^{' T} q_{i}^{'} - 2 q_{i}^{T} R q_{i}^{'})

上面的误差中，只有 $- 2 q_{i}^{T} R q_{i}^{'}$ 中含有优化变量，于是最小化上面的误差函数等效于最大化 $F = \sum q_{i}^{T} R q_{i}^{'}$

$q_{i}^{T} R q_{i}^{'}$ 其实是个标量，我们利用矩阵的迹的性质 $x^{T} A x = t r (A x x^{T})$ ，得到

F = \sum q_{i}^{T} R q_{i}^{'} = tr (R \sum q_{i}^{'} q_{i}^{T})

令 $H = \sum q_{i}^{'} q_{i}^{T}$ ，我们展开看 $\sum q_{i}^{'} q_{i}^{T} = \sum (p_{i}^{'} - {\bar{p}}^{'}) (p_{i} - \bar{p})$ 。

如果我们以随机向量的观点来看的话，随机向量a用a(i)表示（可以理解为点集A中的点），随机向量b用p'(i)表示，a和b的协方差（统计中一般除以n-1）就是

$C o v (a, b) = E {[a (i) - \bar{a}] [b (i) - \bar{b}]^{T}} = \frac{1}{n} \sum_{i = 1}^{n} [a (i) - \bar{a}] [b (i) - \bar{b}]^{T}$
对比H矩阵展开的结果，我们发现H矩阵其实就是A和B点集中点的协方差乘以点的个数n。

对H进行奇异值分解， $H = \sum q_{i}^{'} q_{i}^{T} = U Λ V^{T}$ ，则可以求得旋转矩阵 $R = V U^{T}$ 。

再将求得的R带入 $\bar{p} - (R {\bar{p}}^{'} + t) = 0$ 中求得平移向量 t。

案例讲解

下面我们用Python来实现一个SVD求解点对配准的案例

 import numpy as np
from scipy import linalg
from mpl_toolkits.mplot3d import Axes3D
import matplotlib.pyplot as plt
from scipy.spatial.transform import Rotation
 
# Generate pointset A and B
A = np.random.rand(10,3)
# Random rotation and translation
R = Rotation.random().as_matrix()
print('Rotation matrix:\n ', R)
t = np.random.rand(3)
print('Translation vector:\n ', t)
 
B = []
for i in range(len(A)):
    p = R @ A[i] + t
    print(f'pa:{A[i]} -> pb:{p}')
    B.append(p)
B = np.array(B)
 
fig = plt.figure()
ax1 = Axes3D(fig)
ax1.scatter(A[:,0], A[:,1], A[:,2], c='r', label='A')
ax1.scatter(B[:,0], B[:,1], B[:,2], c='b', marker='x', label='B')
for i in range(len(A)):
    ax1.plot([A[i,0], B[i,0]], [A[i,1], B[i,1]], [A[i,2], B[i,2]], c='k', linewidth=0.5)
ax1.legend()
plt.show()
 
centroid_A = A.mean(axis=0)
centroid_B = B.mean(axis=0)
decenter_A = A - centroid_A
decenter_B = B - centroid_B
 
sum = np.zeros((3,3))
for i in range(len(A)):
    sum += np.outer(decenter_A[i], decenter_B[i])
 
U, S, Vt = linalg.svd(sum) # sum = U @ S @ Vt
R_hat = Vt.T @ U.T
t_hat = centroid_B - R_hat @ centroid_A
print('Estimated rotation matrix:\n', R_hat)
print('Estimated tranlation vector:\n', t_hat)

图3为随机生成的点集A中的十个点，以及经过随机变换后的点集B中的十个点，连线表明了点之间的对应关系。

图4是SVD计算的R, t，可以看到和随机生成的R, t是一致的。

奇异值分解正交矩阵UV的意义

我们使用去质心坐标q带入A, B点对的对应关系中

p_{i} - (R p_{i}^{'} + t) = q_{i} + \bar{p} - [R (q_{i}^{'} + {\bar{p}}^{'}) + t] = q - R q_{i}^{'} + \bar{p} - (R {\bar{p}}_{i}^{'} + t) = q_{i} - R q_{i}^{'} = 0

可以发现在去质心坐标下有 $q_{i} = R q_{i}^{'}$ ，即A中的点 $q_{i}$ 和B中对应的点 $q_{i}^{'}$ 仅相差一个旋转矩阵，我们将求得的旋转矩阵展开

q_{i} = R q_{i}^{'} = V U^{T} q_{i}^{'} \Rightarrow V^{T} q_{i} = U^{T} q_{i}^{'}

U和V分别都是正交矩阵 $U U^{T} = I$ ，我们将他们写成列向量形式， $U = [U_{x}, U_{y}, U_{z}], V = [V_{x}, V_{y}, V_{z}]$ ，带入上式

[U_{x}, U_{y}, U_{z}]^{T} q_{i} = [V_{x}, V_{y}, V_{z}]^{T} q_{i}^{'} \Rightarrow [\begin{matrix} U_{x}^{T} q_{i} \\ U_{y}^{T} q_{i} \\ U_{z}^{T} q_{i} \end{matrix}] = [\begin{matrix} V_{x}^{T} q_{i}^{'} \\ V_{y}^{T} q_{i}^{'} \\ V_{z}^{T} q_{i}^{'} \end{matrix}]

也就是说，在以U的三个列向量为基底的表示下的A中的点 $q_{i}$ 与以V的三个列向量为基底的表示下的B中的对应点 $q_{i}^{'}$ 的是相等的。

$U^{T} q_{i}$ 和 $V^{T} q_{i}^{'}$ 表示的是同一个向量，这个向量在基U下坐标为 $q_{i}$ ，在基V下坐标为 $q_{i}^{'}$ 。

求得的旋转矩阵 $R = V U^{T}$ 其实就是进行了基的变换。

下图中粗一点的坐标轴是U的三个列向量构成的正交基（点集A的坐标系），细一点的坐标轴是V的三个列向量构成的正交基（点集B的坐标系）。

我们再将坐标系绘制在每个点集的质心处，得到下图。我们求解ICP得到的R, t就是这两个坐标系之间的姿态差异和位移。

看到这个坐标轴，读者可能会发现和主成分分析(Principal Component Analysis，PCA)有些类似，后续会用另一篇文章进行介绍。

‍

参考文献

张贤达. 《矩阵分析与应用》第二版

高翔.《视觉SLAM十四讲》

K. S. ARUN, T. S. HUANG, AND S. D. BLOSTEIN. Least-Squares Fitting of Two 3-D Point Sets

posted @ 2023-11-02 20:29 cosmosociologist 阅读(49) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 二. 点云主成分分析之奇异值分解与特征值分解

· 矩阵的奇异值分解（SVD）及其应用

· 12_视觉里程计1_ICP算法

· 奇异值分解

· 3.4 Singular Value Decomposition 阅读笔记

阅读排行：
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型，支持深度思考和联网搜索！
· 使用C#创建一个MCP客户端
· 基于 Docker 搭建 FRP 内网穿透开源项目（很简单哒）
· ollama系列1：轻松3步本地部署deepseek，普通电脑可用
· 按钮权限的设计及实现

公告

昵称： cosmosociologist
园龄： 4年4个月
粉丝： 0
关注： 6

+加关注

2025年3月

日

一

二

三

四

五

六

合集

数学(1)

随笔档案

2023年11月(2)