相关系数

 

001、

相关系数是最早由统计学家卡尔·皮尔逊设计的统计指标,是研究变量之间线性相关程度的量,一般用字母 r 表示。由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数

由于研究对象的不同,相关系数有多种定义方式,较为常用的是皮尔逊相关系数。

研究变量之间线性相关程度的量

a <- c(2, 4, 5, 9, 15)
b <- c(6, 8, 10, 30, 40)
cor(a, b)                  ## 研究变量a和b之间线性相关程度的量。

 

 

002、计算公式

简单讲:两个变量的协方差,再除以两个变量的方差的乘积的平方根

 

 

程序验证:

a <- c(2, 4, 5, 9, 15)
b <- c(6, 8, 10, 30, 40)
cor(a, b)                            ## 直接计算相关系数

cov(a, b)/sqrt(var(a) * var(b))      ## 协方差除以两个变量的方差的乘积的平方根(标准差的乘积)

 

为什么协方差除以方差乘积的平方根就能表示两个变量之间的线性相关呢?

 

posted @   小鲨鱼2018  阅读(306)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2020-09-08 linux 系统如何给软件设置环境变量
点击右上角即可分享
微信分享提示