2022-09-18 11:08阅读: 73评论: 0推荐: 0

读《概率机器人》第3章

§ 1 卡尔曼滤波KF

概述

自己总结:基础的卡尔曼滤波完成了这样的一件事:在一系列线性的前提条件下,在状态转移模型具有正态分布、测量模型具有正态分布的情况下,给出了一个满足正态分布的估计。

前提条件

满足以下条件,则卡尔曼滤波给出的后验状态估计满足正态分布:

  1. 下次状态是上状态的线性变换再加上一个满足正态分布的随机误差,这也称为运动模型。下式中的εt是满足均值为0的正态分布的噪声。

    xt=Atxt1+Btut+εtp(xtut,xt1)=det(2πRt)12exp[12(xtAtxt1Btut)TRt1(xtAtxt1Btut)]

  2. 测量结果是状态的线性变换加上一个满足正态分布的随机误差。同上,δt也是一个满足均值为0的正态分布的噪声。

    zt=Ctxt+δtp(ztxt)=det(2πQt)12exp[12(ztCtxt)TQt1(ztCtxt)]

  3. 初始的估计满足正态分布。

    bel(x0)=det(2πΣ0)12exp[12(x0μ0)TΣ01(x0μ0)]

算法内容

满足以上条件时,卡尔曼滤波按照以下步骤给出满足正态分布的新估计的均值与方差。

输入:μt1,Σt1,ut,zt

输出:μt,Σt

  1. 根据控制量与上一次的状态做出估计

    μ¯t=Atμt1+BtutΣ¯t=AtΣt1AtT+Rt

  2. 使用测量结果更新估计

    Kt=Σ¯tCtT(CtΣ¯tCtT+Qt)1μt=μ¯t+Kt(ztCtμ¯t)Σt=(IKtCt)Σ¯t

推导过程一览

  1. 首先明确一下要推导的是什么:采用下列估计方法

    bel(x¯)=p(xtxt1,ut)p(xt1)dxt1bel(xt)=ηp(ztxt)bel(x¯)

    则可以满足bel(x¯t)=N(μ¯t,Σ¯t),bel(xt)=N(μt,Σt)

    这俩就是第二章的贝叶斯滤波器,看来卡尔曼滤波可以认为是贝叶斯滤波在高斯分布下的特例?

  2. 证明过程也即是将等号右端的各项带入并化简为标准正态分布的形式,最终得到算法内容中描述的μt,Σt的解析表达式。过程中涉及不少关于矩阵微分、求逆的操作。

b站DR_CAN的视频中介绍了另一种得到卡尔曼增益Kt的推导思路。该思路从另一个角度切入,寻求使用不太准的模型预测结果μ¯t与测量结果反推的Ct1zt线性组合来得到更准确的估计,于是就有了下式:

μt=αCt1zt+(1α)μ¯=μ¯+α(Ct1ztμ¯)=μ¯+αCt1(ztCtμ¯)

一个准确的估计的方差应该尽可能小,选择合适的α使得μt的方差达到最小,恰好就可以发现\(\alpha C_t^{-1=K_t\)

§ 2 扩展卡尔曼滤波EKF

概述

在卡尔曼滤波基础之上,扩展卡尔曼滤波尝试放宽前提条件中的1和2,也它在即尝试处理状态转移模型和测量模型不是线性的情况。扩展卡尔曼滤波面对非线性时所采取的的方法是比较简单的:在上一次估计的均值处进行一阶近似,然后用所得的线性模型代替非线性模型,剩余内容就和卡尔曼滤波相同了。

算法内容

假设现在的运动模型和测量模型为

xt=g(xt1,ut)+εtzt=h(xt)+δt

定义GH

Gt=g(xt1,ut)xt1Ht=h(xt)xt1

则扩展卡尔曼滤波表示为

  1. 根据控制量与上一次的状态做出估计

    μ¯t=g(xt1,ut)Σ¯t=GtΣt1GtT+Rt

  2. 使用测量结果更新估计

    Kt=Σ¯tHtT(HtΣ¯tHtT+Qt)1μt=μ¯t+Kt[zth(μ¯t)]Σt=(IKtHt)Σ¯t

影响近似好坏的因素

  1. 上一次估计的不确定性,不确定性越小,近似越准。

  2. 模型在上一次估计均值附近的线性程度,越接近线性,近似越准。

下边这两张图就分别说明了不确定性和线性程度对估计精度的影响,其中每一个子图的左上角的图中,虚线是扩展卡尔曼滤波的结果,未涂成灰色的实线是蒙特卡罗法的结果。

image-20220904185137537image-20220904185047964

§ 3 无迹卡尔曼滤波UKF

前边两个卡尔曼中的先验估计的方差Σ¯t和测量模型的方差CtΣ¯tCtT(KF)/HtΣ¯tHtT(EKF)都是基于上一次的估计与状态转移模型计算的,而无迹卡尔曼滤波的方差则使用上一次的估计结合若干转移后的采样点直接计算。

书上给出了一种固定的取点方式,但对其合理性并未做太多说明。另外书中还有提到在不少的应用场景中UKF和EKF表现差不多,不过UKF在计算雅可比矩阵困难时会更有优势。

§ 4 信息滤波IF

各种KF中均使用均值和方差来描述正态分布,信息滤波则相当于是换了一组描述正态分布的参数的KF,其使用的信息矩阵Ω与信息向量ξ定义如下:

Ω=Σ1ξ=Σ1μ

书上有提到IF相对KF的一些优缺点,暂时太理解。

本文作者:Harold_Lu

本文链接:https://www.cnblogs.com/harold-lu/p/16704440.html

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   Harold_Lu  阅读(73)  评论(0编辑  收藏  举报
评论
收藏
关注
推荐
深色
回顶
收起
点击右上角即可分享
微信分享提示