Robotics机器人学中的SLAM背景知识、详细介绍与论文解读

《视觉SLAM十四讲》 simultaneous localization and mapping
part0 基础中的基础背景知识
模型矩阵（Model Matrix）、视图矩阵（View Matrix）和投影矩阵（Projection Matrix）
常用的 C++ 库：Eigen 和 Sophus
惯性导航
MonoSLAM和Kalman Filter
- MonoSLAM
- A Multi-state Constraint Kalman Filter for Vision-aided Inertial Navigation
part1 数学基础
part2 实践应用
基于3DGS的SLAM（论文解读）
光栅化（Rasterization）
卡尔曼滤波器 Kalman Filter
概率机器人（中科大）ProbabilisticRobotics
机器人学中的状态估计 StateEstimationforRobotics
顶级 2000+pages的handbook of robotics

回到顶部

《视觉SLAM十四讲》 simultaneous localization and mapping

视觉SLAM的基础知识-高翔_bilibili

Def.of SLAM
Sensors：The methods and difficulty of SLAM depend heavily on the equipped sensors.

Lasers
·Accurate
·Fast
·Long history in research
·Heavy
·Expensive
.Examples:SICK,Velodyne,Rplidar
Cameras
·Cheap
·Light-weight
·Rich information
·High computation cost
·Work under assumptions
·Categories:monocular,stereo,RGBD

视觉离人的感知还很遥远。
稠密SLAM对计算资源的消耗还是比较高。
大部分SLAM都需要在特定的假设下才能正常工作

《视觉SLAM十四讲》笔记摘抄

视觉SLAM-来自RMer

全日制学生混的【一起读书】视觉SLAM十四讲有很多自己的理解和经验

可爱的学姐讲的通俗易懂的视觉SLAM

回到顶部

part0 基础中的基础背景知识

bg: background 你需要的背景知识
和上面视觉SLAM-来自RMer有一点重合

回到顶部

模型矩阵（Model Matrix）、视图矩阵（View Matrix）和投影矩阵（Projection Matrix）

共同点：将3D空间中的物体从局部坐标系变换到屏幕上的2D像素坐标
goal: 在光栅化的过程中帮助实现几何变换和坐标变换

1.模型矩阵（Model Matrix）

bg: 物体的每个顶点在创建时通常位于局部坐标系中（它们的原点是相对于物体本身的）
局部坐标系（object space）→ 模型矩阵（Model Matrix）【平移、旋转、缩放】 → 世界坐标系（world space）
平移矩阵：移动物体的位置
旋转矩阵：旋转物体
缩放矩阵：调整物体的大小

$ P _ { w o r l d } = M _ { m o d e l } \cdot P _ { l o c a l } $

模型矩阵 $ M _ { m o d e l } $

物体局部坐标系中点$ P _ { 1 o c a l } $

物体在世界坐标系中位置 $ P _ { w o r l d } $

2.视图矩阵（View Matrix）

$ P _ { c a m e r a } = M _ { v i e w } \cdot P _ { w o r l d }$

$ M _ { v i e w }$ 视图矩阵

$ P _ { w o r l d }$ 物体在世界坐标系中的位置

$ P _ { c a m e r a }$ 物体在摄像机坐标系中的位置

3.投影矩阵（Projection Matrix）

将3D坐标转换为屏幕空间的2D坐标
将视图空间中的坐标转换为标准化设备坐标（Normalized Device Coordinates, NDC），并且还处理了透视效果
$ P _ { n d c } = M _ { p r o j e c t i o n } \cdot P _ { c a m e r a }$

投影矩阵 $ M _ { p r o j e c t i o n }$

物体在摄像机坐标系中的位置 $ P _ { c a m e r a }$

物体在标准化设备坐标中的位置$ P _ { n d c }$

类别	模型矩阵	视图矩阵	投影矩阵
作用	局部坐标系→世界坐标系	世界坐标系→摄像机坐标系	摄像机坐标系→屏幕坐标系，同时处理透视变换

来自：Metal 学习笔记四（2）：坐标空间

正交投影和透视投影

特性	正交投影	透视投影
英文	Orthographic Projection	Perspective Projection
直觉	不考虑距离对大小的影响，即无论物体距离远近，它们看起来大小都相同。	模拟人类视觉，远处的物体看起来较小，近处的物体看起来较大。投影矩阵会根据物体距离摄像机的远近，调整物体的大小。
投影线	平行投影线	会聚于一个或多个消失点
距离影响	距离不影响物体的大小	远处的物体显得较小，近处显得较大
应用场景	工程制图、机械设计、建筑设计等一些特殊的场景渲染	艺术创作、三维建模、现实感渲染
真实感	主要用于精确描述物体的形状和尺寸	用于表现现实世界中的视觉效果
视图数量	通常需要多个视图来全面描述物体	单一视角下能够看到物体的整体

回到顶部

常用的 C++ 库：Eigen 和 Sophus

C++ 库	Eigen	Sophus
目的	进行高效的矩阵和向量运算，以及线性代数、数值计算等操作	计算特殊欧氏群（SE(3)、SE(2)）和李群（SO(3)、SO(2)）等几何对象
应用	计算机视觉、物理模拟、机器学习等需要处理大量线性代数的应用	机器人学和 SLAM（同步定位与地图构建）等领域
功能	①矩阵与向量运算：Eigen 提供了各种维度的矩阵与向量类型，可以进行矩阵乘法、转置、逆、行列式计算等。②线性代数操作：Eigen 支持常见的线性代数操作，如特征值分解、QR 分解、SVD 分解等，适合求解方程组、优化等问题。③几何操作：Eigen 提供了旋转矩阵、变换矩阵、四元数等几何运算支持，广泛用于 3D 计算。④高效与便捷：由于采用了模板元编程，Eigen 在性能上接近手写优化的代码，特别适合需要高效矩阵运算的场景。⑤易用性：Eigen 的接口设计简洁，语法类似数学表达式，方便上手和集成。	①李群与李代数：Sophus 实现了常见的李群（如 SE(3) 表示三维旋转和平移的组合）和李代数（SE(3) 的对数映射）之间的转换。②几何变换：Sophus 提供了高效的几何变换计算工具，能够处理旋转、平移、刚体运动等常见的 2D 和 3D 几何变换。③数值优化中的应用：Sophus 经常被用在 SLAM、视觉里程计、计算机视觉中的优化问题，如最小化重投影误差等，提供了合适的几何表示来进行数值计算。
关系	Sophus 库依赖于 Eigen 库进行底层的矩阵和向量运算。Sophus 提供了对李群、李代数和几何变换的具体实现，而这些实现背后则使用了 Eigen 的矩阵操作。