基础:
前提:
1.数据是连续的
年龄、体重、血压、温度
2.检验数据是否正太分布
符合正态分布-->皮尔逊
不符合--->斯皮尔曼
疑问:
1. 多变量进行相关性分析,是不是每个参数都是连续型的?
皮尔逊是,斯皮尔曼不是
2.多变量进行相关性分析,是不是都要单独判断每个变量是否符合正太分布?
如果每个变量都是正态分布的,那么使用皮尔逊相关系数是合适的。但如果一个或多个变量不遵循正态分布,你可能需要使用非参数方法,如斯皮尔曼等
操作
谁和谁之间有相关性,就把谁放在右边
结果:
看对角线的上面或者下面,看一个就行
判断:
先看Sig(显著性也叫P值),p<0.05,说明二者是有相关性的
再看相关系数,.469**,说明相关性是中等吧,
但是不能判断因果关系,A的增加影响的B。还是B增加影响了A
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!