基础: 

  前提:

    1.数据是连续的

      年龄、体重、血压、温度

    2.检验数据是否正太分布

      符合正态分布-->皮尔逊

      不符合--->斯皮尔曼

 

  疑问:

    1. 多变量进行相关性分析,是不是每个参数都是连续型的?

      皮尔逊是,斯皮尔曼不是

    2.多变量进行相关性分析,是不是都要单独判断每个变量是否符合正太分布?

      如果每个变量都是正态分布的,那么使用皮尔逊相关系数是合适的。但如果一个或多个变量不遵循正态分布,你可能需要使用非参数方法,如斯皮尔曼等

 

操作

谁和谁之间有相关性,就把谁放在右边

 

结果:

看对角线的上面或者下面,看一个就行

 

判断:

先看Sig(显著性也叫P值),p<0.05,说明二者是有相关性的

再看相关系数,.469**,说明相关性是中等吧,

但是不能判断因果关系,A的增加影响的B。还是B增加影响了A

 

posted on   黑逍逍  阅读(6)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!



点击右上角即可分享
微信分享提示