均值和最小二乘法

有一维数组 [x1,x2...xn],要求一个值X,使得:

F(X) = (X-x1)2+(X-x2)2+...(X-xn)2 = min

F(X) = nX2 -  2 * (x1+x2+....+xn) + x12 + x22 + ...+xn2 = min 

对X求导,当dF/dX = 0时,F(X)有极小值;

2nX - 2 (x1+x2+....+xn) = 0 

那么,X =  (x1+x2+....+xn) / n

因此,在一维的情况下,最小二乘求参数X,和求均值一样;

使用矩阵的方法,先建立方程组:

X - x1 = 0

...

X - xn = 0

也就是方程组:

An*1X =b,等价于  [1,1,......] T X = [x1,x2...xn] T;

ATAX = ATb

同样解得:X =  (x1+x2+....+xn) / n


 

应用:在一维中,有[2,2,2,2,2,10]这样子的数组,找出其中的孤值

先求出 X = 均值 =  3.333

中误差 = sqrt [ [(2-3.333)2 +  (2-3.333)2 +  (2-3.333)2 +  (2-3.333)+  (2-3.333)2 + (10-3.333)2 ] / (6-1) ] = 3.1622

假如一维数组是对一段距离的观测值,假设服从正态分布N[ μ,σ2] , u应该是接近2的数字,但实际上是不可知道的,样本量大时,通常用X和中误差来代替 

|xn - u| > 2σ  的概率,为 1 - 95.449974%;

|xn - u| > 3σ  的概率,为 1 - 99.730020%;

所以,基于这个原理,|10 - 3.3333 | ≈ 2σ ,是属于小概率事件,所以认为10是孤值;


 加权最小二乘法;

假如,为上面每个数字,求加权平均值,假如权值分别为[p1,p2....pn],假如为[1,1,1,1,1,1/5]

加权并不是:X =( 2+ 2 + 2 + 2 +2 + 1 / 5 * 10 )/ 6 = 2;

而是F(X) =  p1(X-x1)2+p2(X-x2)2+...p3(X-xn)2 = min

 F'(X) = 2 (p1 + p2 + ... pn) - 2 (p1x1 + p2x2 + ... + pnXn)

因此X = (p1x1 + p2x2 + ... + pnXn) / (p1 + p2 +...+pn) = 12 / 5.2 = 2.3 

如同解 ATPAX = ATPb

 p越大,说明对某个观测值越信赖,对其误差也越信赖;


关于误差传播

假如x经过n次读数,其中误差 = Σ(xi - xavg)² / n,用矩阵的形式,就是Dxx = [x1-xavg ,x2-xavg,... xn-xavg]  [x1-xavg ,x2-xavg,... xn-xavg] T / n 

* 定义函数E(x)为求x的均值,那么Dxx = E[ [x1-xavg ,x2-xavg,... xn-xavg]  [x1-xavg ,x2-xavg,... xn-xavgT]

假如 y = ax,那么,其中误差 = Σ(axi - axavg)² / n = a, 就是Dyy = a2 Dxx

因此,在一元的情况下 y = ax,y的方差D(Y) = a2 Dxx

多元的情况下:

z = ax - by ,用矩阵的形式表示,那么 Z = [a,b][x,y]= KX

E(Z) = KE(X)

证明:

E(X) = [E(x),E(y)]T 

E(Z) = ∑z / n  = a * ∑x / n + b∑y / n  = aE(x) + bE(y) = K[E(x),E(y)]T =  KE(X)

D(Z) = E ( [Z-E(Z)] [Z-E(Z)]T)

   =  E ( [KX - KE(X)] [ KX - KE(X)]T

   =   E ( K[X -  E(X)] [ X -  E(X)]T KT)   (KA)T = ATKT

   =  KE ( [X -  E(X)] [ X -  E(X)]) KT

Dxx = E ( [X -  E(X)] [ X -  E(X)])   = [x-xavg ,y-yavg   [x-xavg ,y-yavg ]   / n

 X = [x,y], E(X) = [E(x),E(y)]T

因此,Dxx 对角  (x-E(x))(x-E(x))T / n,为x的方差; (y-E(y))(y-E(y))T / n 为y的方差;

非对角 (x-E(x))(y-E(y))T / n ,为x和y的协方差;

协方差的本质,是形容X的曲线,和Y的曲线的相似程度,其横轴均为样本序列


在实际解算的时候,如果两种观测量(x和y)是完全不相关的,例如: x代表测角、y代表测距 ,即使(x-E(x))(y-E(y))T / n ≠ 0,在Dxx的非对角处,任然写为0值;

因此求Dzz要追根朔源

假如有:

z1 = a1x + b1y

z2 = a2x + b2y

z1和z2如何才是独立观测量,完全不相关?

等价于Dzz,非对角线元素为0

 

 隐含条件:

1. a1、b1不能同时为0 ,否则相当于Z1没有意义;

2. a2、b2不能同时为0 ,否则相当于Z2没有意义;

3. σxx 和 σyy 均不能等于0,否则解算没有意义,因为没有误差传递;

那么,要使得非对角线为0,那么:

1. a1 = 0 ,b2 = 0, σxy = 0;

1. b1 = 0 ,a2 = 0, σxy = 0;

没有别的选择;

因此,x、y必须是独立观测的,不相关的观测量,而且,Z的方程组,每条方程的自变量均不相同,要么:

z1 = a1x  

z2 = b2y

或者

z1 = b1y

z2 = a2x  

 

posted on 2019-08-15 18:56  耀礼士多德  阅读(4062)  评论(0编辑  收藏  举报