视觉 slam 14讲 笔记
1. 视觉里程计中的里程计怎么理解呢
在视觉里程计(Visual Odometry)中,“里程计”(Odometry)的概念可以理解为对物体(通常是移动机器人、车辆或飞行器等)在一段时间内所行走的路径和位移的测量和估计。
- 里程计的起源和传统含义
里程计一词最早来源于机械式里程表,它是一种安装在车辆上的装置,用于测量车辆行驶的总距离。这种机械式里程表通过与车轮相连的齿轮系统来记录车轮的旋转次数,进而计算出车辆的行驶里程。例如,汽车的里程表就是一种典型的里程计,它通过车轮的转速和车轮的周长来计算车辆的行驶距离。 - 在视觉里程计中的含义
在视觉里程计中,“里程计”被扩展为一种更广义的位移测量工具。它不再依赖于机械装置,而是通过视觉传感器(如摄像头)来获取环境信息,并通过图像处理和计算机视觉算法来估计物体的运动轨迹和位移。
运动估计:视觉里程计的核心任务是估计相机(或搭载相机的移动平台)在连续帧之间的相对运动。例如,通过比较连续两帧图像中的特征点位置变化,可以计算出相机的平移和旋转运动。
路径重建:通过不断累积这些相对运动,可以重建出相机的运动轨迹。这个轨迹可以看作是相机在空间中行走的“里程”,类似于传统里程计记录车辆行驶路径的功能。 - 视觉里程计与传统里程计的对比
传统里程计:
基于物理传感器:依赖于机械装置(如车轮转速传感器)或惯性传感器(如加速度计和陀螺仪)。
测量方式:直接测量物理量(如车轮转速、加速度等),并通过物理模型计算位移。
优点:精度较高,受环境影响小(如光照、地形等)。
缺点:容易受到机械磨损、传感器漂移等因素影响。
视觉里程计:
基于视觉传感器:主要依赖摄像头获取图像数据。
测量方式:通过图像特征匹配、光流法或深度学习等方法估计运动。
优点:不需要接触物体,可以在复杂环境中工作,成本较低。
缺点:受光照、纹理稀疏等因素影响较大,精度可能不如传统里程计。 - 视觉里程计的应用
视觉里程计在许多领域都有广泛应用,例如:
机器人导航:帮助机器人在未知环境中自主导航,实时估计自身位置和运动轨迹。
自动驾驶:用于车辆的定位和路径规划,辅助高精度地图的构建。
无人机飞行:帮助无人机在室内或GPS信号弱的环境中进行定位和避障。
总之,在视觉里程计中,“里程计”可以理解为一种基于视觉信息的位移和运动轨迹估计工具,它通过图像分析来实现类似传统里程计的功能,但更加灵活和适应性强。
2. 书中这么写的 是什么意思呢
现在只需知道,VO能够通过相邻帧间的图像估计相机运动,并恢复场景的空间结构。称它为“里程计”是因为它和实际的里程计一样,只计算相邻时刻的运动,而和再往前的过去的信息没有关联。在这一点上,VO就像一种只有短时间记忆的物种。
这段话的描述非常形象地解释了视觉里程计(VO)的一个关键特性:它只关注相邻帧之间的运动估计,而不考虑更早时间的信息。下面我来详细解释一下这段话的意思:
- VO通过相邻帧估计相机运动
视觉里程计的核心任务是利用连续的图像帧来估计相机(或搭载相机的移动平台)的运动。具体来说:
输入:连续的图像帧(通常是摄像头拍摄的图像序列)。
处理:通过图像特征匹配、光流法或其他计算机视觉技术,计算当前帧与上一帧之间的相对运动(包括平移和旋转)。
输出:得到相机从上一时刻到当前时刻的运动估计。
例如,假设你有一系列图像帧 \(I1,I2,I3,…\),视觉里程计会分别估计从 I1 到 I2、从 I2 到 I3 等相邻帧之间的运动。 - 恢复场景的空间结构
除了估计相机的运动,视觉里程计还可以通过三角测量等方法恢复场景中物体的三维空间结构。简单来说,通过分析图像中特征点在不同视角下的位置变化,可以推断出这些特征点在三维空间中的位置。这类似于人类通过双眼视差感知深度的过程。 - 为什么称它为“里程计”
这里的关键在于视觉里程计的工作方式与传统里程计的相似性:
传统里程计:例如汽车的里程表,它通过车轮的转速和周长来计算每次车轮旋转所行驶的距离。每次计算只依赖于当前的车轮转速和上一次的累计里程,而不会考虑更早之前的信息。
视觉里程计:同样地,视觉里程计每次只计算相邻两帧之间的相对运动,而不考虑更早的帧的信息。这种“只关注相邻时刻”的特性与传统里程计的工作方式非常相似。 - 短时间记忆的类比
书中将视觉里程计比作“只有短时间记忆的物种”,这个类比非常形象:
短时间记忆:视觉里程计每次只处理相邻两帧之间的信息,就像一个人只记得最近发生的事情,而忘记了更早之前的事情。
不依赖历史信息:这种特性使得视觉里程计的计算相对简单,因为每次只需要处理少量的数据(即相邻两帧)。但这也带来了一个缺点:如果连续的帧之间出现误差积累(例如特征点匹配错误),这些误差会逐渐累积,导致最终的轨迹估计出现偏差。
总结
这段话的核心意思是:视觉里程计通过相邻帧之间的图像信息来估计相机的运动,并恢复场景的三维结构。它被称为“里程计”,是因为它的工作方式类似于传统里程计——每次只计算相邻时刻的运动,而不依赖更早的历史信息。这种特性使得视觉里程计具有“短时间记忆”的特点,既简单高效,但也容易受到误差积累的影响。
分类:
视觉定位和建图
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!