相关系数

在概率论和统计学中,相关(Correlation,或称相关系数或关联系数)显示两个随机变量之间线性关系的强度和方向。在统计学中,相关的意义是用来衡量两个变量相对于其相互独立的距离。在这个广义的定义下,有许多根据数据特点而定义的用来衡量数据相关的系数。

对于不同测量尺度的变量,有不同的相关系数可用:

  • Pearson相关系数(Pearson's r):衡量两个等距尺度或等比尺度变量之相关性。是最常见的,也是学习统计学时第一个接触的相关系数
  • Spearman等级相关系数:衡量两个次序尺度变量之相关性。
  • Kendall等级相关系数(英语:Kendall tau rank correlation coefficient):衡量两个人为次序尺度变量(原始资料为等距尺度)之相关性。
  • Kendall和谐系数:衡量两个次序尺度变量之相关性。
  • Gamma相关系数:衡量两个次序尺度变量之相关性。
  • Phi相关系数(英语:Phi coefficient):衡量两个真正名目尺度的二分变量之相关性。
  • 列联相关系数(contingency coefficient):衡量两个真正名目尺度变量之相关性。
  • 净相关(partial correlation):在模型中有多个自变量(或解释变量)时,去除掉其他自变量的影响,只衡量特定一个自变量与因变量之间的相关性。自变量和因变量皆为连续变量。
  • 相关比(correlation ratio):衡量两个连续变量之相关性。
  • 四分相关(tetrachoric correlation):衡量两个人为名目尺度(原始资料为等距尺度)的二分变量之相关性。
  • Kappa一致性系数(K coefficient of agreement):衡量两个名目尺度变量之相关性。
  • 点二系列相关系数(point-biserial correlation):X变量是真正名目尺度二分变量。Y变量是连续变量。

二系列相关系数(biserial correlation):X变量是人为名目尺度二分变量。Y变量是连续变量。

posted @ 2015-04-23 15:37  wangyubo  阅读(3377)  评论(0编辑  收藏  举报