教小高改bug

  博客园 :: 首页 :: 博问 :: 闪存 :: :: 联系 :: :: 管理 ::

1. 散点图的用途

散点图是用两组数据构成多个坐标点,观察坐标点的分布,判断两者之间是否存在某种关联或总结坐标点的分布模式。

从散点图上可以解读两个变量的相互关系,所以一般用于做相关性分析。

2. 什么是相关性分析

对两个或多个具备相关性的变量元素进行分析,从而衡量两个因素的的相关密切程度。通常用来分析两组或多组数据的变化趋势是否一致。比如熬夜频率与脱发是否相关? 再比如,天气温度是否与碳排放量多少相关?

临床上也需要分析两种疾病的相关性,比如新冠肺炎与心血管疾病的发生是否相关?相关性强弱如何?····这些问题都可以用相关性分析来解决,那么也可以用散点图的形式展现出来。

3. 相关性分析包括哪些内容?

变量间是否存在相关关系?

存在什么相关关系?线性 or 非线性?正相关 or 负相关?

相关性大小?强弱?

4. 相关性散点图怎么看?

1) 坐标轴:

x,y轴分别代表2个变量;

2) 相关性判断:

通过计算相关性系数判断相关性(主要是r值)

相关系数r是反映两个变量之间线性相关程度的指标(R2称为判定系数,用于评估回归模型系数拟合优度)

r的取值范围是[-1,1]。

相关关系的方向:正相关,则r>0;负相关,则r<0

相关关系的强弱:

3) 相关性系数的计算(前两种最常用)

Pearson系数:也叫线性相关系数,用于进行线性相关分析,是最常用的相关系数,当数据满足正态分布时会使用该系数。

Spearman系数:当数据不满足正态分布时,使用该系数。

Kendall系数:通常用于评分数据一致性水平研究(非关系研究)

4) 显著性判断(p值)

P值是用来进行显著性检验的,用来检验变量之间是否有差异以及差异是否显著,P值<0.05,代表数据之间存在显著性的差异。

示例:从图中我们可以得到的信息如下上图x,y轴就分别为LAG3和TRPV3的表达量;  相关性系数是通过Spearman系数来计算的;r=0.287,P<0.001:说明LAG3和TRPV3的表达呈显著弱正相关关系;

5. 其他形式的相关性散点图

不一样的只是形式,解图的方法还是不变,万变不离其宗

 

  (上图显示的是强正相关关系,计算2种相关系数,还标出了回归曲线方程和R2数值,信息比较全面,doi: 10.1016/j.intimp.2020.106828

  (上图显示的是负相关关系,doi: 10.3389/fimmu.2022.872170

 (这张显示的是非线性相关关系,doi: 10.1016/j.intimp.2020.106828

 

  (这种散点图就是来观察样本分布的,与上面展示相关性的散点图有很大差别,doi: 10.3389/fcell.2022.793425

posted on 2022-10-03 20:42  小高不高  阅读(7197)  评论(0编辑  收藏  举报