标准化(Z-score)

标准化(Z-score)是用于将不同微生物的丰度数据进行标准化处理,以便在热图中更容易比较和解释不同样本之间的差异。具体来说,标准化的过程如下:

abundance <- scale(
  abundance, 
  center = TRUE, # 减去均值
  scale = TRUE # 除以标准差
)

标准化过程详解:

  1. 减去均值(center = TRUE

    • 对每个微生物(列)来说,计算其在所有样本(行)中的均值。
    • 将每个样本的丰度值减去该微生物的均值。这一操作可以使得数据的均值为0,从而消除不同微生物由于丰度水平差异带来的影响。
  2. 除以标准差(scale = TRUE

    • 对每个微生物(列)来说,计算其在所有样本(行)中的标准差。
    • 将每个样本的丰度值(已经减去均值)除以该微生物的标准差。这一步将数据按标准差进行缩放,使得不同微生物的丰度值在标准化后具有相同的单位和尺度。

标准化的效果:

  • 均值为0:标准化后的每个微生物丰度数据的均值为0。
  • 方差为1:标准化后的每个微生物丰度数据的标准差为1。

这种标准化处理的好处是,使得不同微生物的丰度数据具有可比性,即使它们的原始丰度水平相差很大。通过这种处理,我们可以在热图中更清楚地看到哪些样本中哪些微生物的丰度相对较高或较低。

举例说明:

假设有三个样本(A, B, C)和两个微生物(X, Y)的丰度数据如下:

  X Y
Sample A 10 50
Sample B 12 55
Sample C 14 60
  1. 计算均值和标准差:

    • 微生物X:均值 = (10 + 12 + 14) / 3 = 12,标准差 = 2
    • 微生物Y:均值 = (50 + 55 + 60) / 3 = 55,标准差 = 5
  2. 标准化:

    • 微生物X:标准化后为 [(10-12)/2, (12-12)/2, (14-12)/2] = [-1, 0, 1]
    • 微生物Y:标准化后为 [(50-55)/5, (55-55)/5, (60-55)/5] = [-1, 0, 1]

标准化后的数据:

X Y
Sample A -1 -1
Sample B 0 0
Sample C 1 1

通过标准化处理后,尽管原始丰度数据差别很大,但标准化后的数据都在同一个尺度上,这使得我们在热图中更容易识别出哪些样本中哪些微生物丰度相对较高或较低。

posted @ 2024-07-05 09:53  王哲MGG_AI  阅读(18)  评论(0编辑  收藏  举报