相关系数与线性空间内积心得

只总结不证明。

1,相关系数实质上是向量夹角余弦。

2,协方差矩阵矩阵是实对称矩阵。如果随机变量们线性无关的话,它们就可以看做一组基,所以此时,协方差矩阵实质上是度量矩阵。如果两个随机变量独立,那么它们正交,一组正交的单位向量是标准正交基,标准正交基的度量矩阵是单位矩阵。因之,一组两两独立的、方差均等于1的随机变量,它们的协方差矩阵是单位矩阵。

3,实数域上的度量矩阵是正定的,这可以推出柯西不等式来。

3,相关系数在数据挖掘的表现形式为:

  b 非b
a f(1,1) f(1,0)
非a f(0,1) f(0,0)

[f(1,1)f(0,0)-f(0,1)f(1,0)]/根号下[f(1,*)f(*,1)f(0,*)f(*,0)]

其中f(1,*)=f(1,1)+f(1,0)。其他同理。

4,内积在欧几里得空间里变现形式为分量相乘的和。 在希尔伯特空间里表现为相乘函数的积分。在概率论里表现为协方差。因之,三个领域均有对应的Cauchy–Schwarz inequality

posted on 2013-07-10 07:08  monoid  阅读(1021)  评论(0编辑  收藏  举报

导航