相关系数
001、
相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。
研究变量之间线性相关程度的量。
a <- c(2, 4, 5, 9, 15) b <- c(6, 8, 10, 30, 40) cor(a, b) ## 研究变量a和b之间线性相关程度的量。
002、计算公式
简单讲:两个变量的协方差,再除以两个变量的方差的乘积的平方根。
程序验证:
a <- c(2, 4, 5, 9, 15) b <- c(6, 8, 10, 30, 40) cor(a, b) ## 直接计算相关系数 cov(a, b)/sqrt(var(a) * var(b)) ## 协方差除以两个变量的方差的乘积的平方根(标准差的乘积)
为什么协方差除以方差乘积的平方根就能表示两个变量之间的线性相关呢?
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2020-09-08 linux 系统如何给软件设置环境变量