协方差

通俗地讲, 协方差可以理解为:两个变量在变化过程中是同方向变化?还是反方向变化?同向或反向程度如何?
你变大,同时我也变大,说明两个变量是同向变化的,这时协方差就是正的。
你变大,同时我变小,说明两个变量是反向变化的,这时协方差就是负的。
从数值来看,协方差的数值越大,两个变量同向程度也就越大。反之亦然。

协方差公式化简一下: Cov(X,Y) = E[(X-μx)(Y-μy)]Cov(X,Y)=E[(Xμx)(Yμy)]
如果有X,Y两个变量,每个时刻的“X值与其均值之差”乘以“Y值与其均值之差”得到一个乘积,再对这每时刻的乘积求和并求出均值(其实是求“期望”,但就不引申太多新概念了,简单认为就是求均值了.

下面举个例子来说明吧:

比如有两个变量X,Y,观察t1-t7(7个时刻)他们的变化情况。
简单做了个图:分别用红点和绿点表示X、Y,横轴是时间。可以看到X,Y均围绕各自的均值运动,并且很明显是同向变化的。

这里写图片描述

这时,我们发现每一时刻X-μ{x}Xμx的值与Y-μ{y}Yμy的值的“正负号”一定相同(如下图:比如t1时刻,他们同为正,t2时刻他们同为负):
这里写图片描述

所以,像上图那样,当他们同向变化时,X-μ{x}XμxY-μ{y}Yμy的乘积为正。这样,当你把t1-t7时刻X-μ{x}XμxY-μ{y}Yμy的乘积加在一起,求平均后也就是正数了。
这里写图片描述

如果反向运动呢?
很明显,X-μ{x}Xμx的值与Y-μ{y}Yμy的值的“正负号”一定相反,于是X-μ{x}XμxY-μ{y}Yμy的乘积就是负值了。这样当你把t1-t7时刻X-μ{x}XμxY-μ{y}Yμy的乘积加在一起,求平均的时候也就是负数了。

当然上面说的是两种特殊情况,很多时候X,Y的运动是不规律的,比如:

clipboard.png

这时,很可能某一时刻X-μ{x}Xμx的值与Y-μ{y}Yμy的值乘积为正,另外一个时刻X-μ{x}Xμx的值与Y-μ{y}Yμy的值乘积为负。

这时,很可能某一时刻X-μ{x}Xμx的值与Y-μ{y}Yμy的值乘积为正,另外一个时刻X-μ{x}Xμx的值与Y-μ{y}Yμy的值乘积为负。
所以,t1-t7时刻中,X-μ{x}XμxY-μ{y}Yμy的乘积为正的越多,说明同向变化的次数越多,也即同向程度越高。反之亦然。
总结一下,如果协方差为正,说明X,Y同向变化,协方差越大说明同向程度越高;如果协方差为负,说明X,Y反向运动,协方差越小说明反向程度越高。

那如果X,Y同向变化,但X大于均值,Y小于均值,那X-μ{x}XμxY-μ{y}Yμy的乘积为负值啊?这不是矛盾了吗?
这种情况是有可能出现的,比如:

clipboard.png

可以看到,t1时刻,X-μ{x}XμxY-μ{y}Yμy的符号相反,他们的乘积为负值。
但是,总体看,这两个变量的协方差仍然是正的,因为你还要计算t2,t3……t7时刻X-μ{x}XμxY-μ{y}Yμy的乘积,然后再把这7个时刻的乘积求和做均值,才是最后X,Y的协方差。1个负、6个正,显然最后协方差很大可能性是正的。

所以t1时刻X-μ{x}XμxY-μ{y}Yμy的乘积为负值,并不能说明他们反向运动,要结合整体的情况来判断。
那么你可能又要问了,既然都是同向变化,那t1时刻X-μ{x}XμxY-μ{y}Yμy的乘积为负值、其他时刻乘积为正的这种情况,与,t1-t7时刻X-μ{x}XμxY-μ{y}Yμy的乘积均为正值的情况,到底有什么差异呢?这点其实前面也解释过了,差异就是:第一种情况的同向程度不如第二种情况的同向程度大(第一种情况6正1负,第二种情况7正,所以第一种情况的协方差小于第二种情况的协方差,第一种情况X,Y变化的同向程度要小于第二种情况)。
另外,如果你还钻牛角尖,说如果t1,t2,t3……t7时刻X,Y都在增大,而且X都比均值大,Y都比均值小,这种情况协方差不就是负的了?7个负值求平均肯定是负值啊?但是X,Y都是增大的,都是同向变化的,这不就矛盾了?
这个更好解释了:这种情况不可能出现!
因为,你的均值算错了……
X,Y的值应该均匀的分布在均值两侧才对,不可能都比均值大,或都比均值小。

clipboard.png

所以,实际它的图应该是下面这样的:

clipboard.png

发现没有,又变成X-μ{x}XμxY-μ{y}Yμy的符号相同的情况了~有没有种被大自然打败的感觉~
好了,现在,对于协方差应该有点感觉了吧?

posted @ 2020-09-15 21:17  茶苦茶香工作室  阅读(1509)  评论(0编辑  收藏  举报