10、探针组检测值的计算过程

  一组探针是否能被检测到,可以用检测值来表示。simpleaffy包的detection.p.val方法默认alpha1=0.05alpha2=0.065。检测值小于alpha1A(无,Absent),介于alpha1alpha2之间为M(不确定,Marginal Present),大于alpha2P(有,Present)。

 

以样品GSM286756.CEL为例,计算它的231211_s_at探针组的检测值:

library(affy)

library(simpleaffy)

rawData <- ReadAffy("GSM286756.CEL")

> pm(rawData,"231211_s_at")

             GSM286756.CEL

231211_s_at1            78

231211_s_at2            85

231211_s_at3            80

231211_s_at4           101

231211_s_at5            86

231211_s_at6            92

231211_s_at7           110

231211_s_at8           114

 

> mm(rawData,"231211_s_at")

             GSM286756.CEL

231211_s_at1            66

231211_s_at2            85

231211_s_at3           123

231211_s_at4           131

231211_s_at5            72

231211_s_at6            67

231211_s_at7           114

231211_s_at8           117

 

dpv<-detection.p.val(rawData,calls = FALSE)

dpv中可找到231211_s_at探针组对应的检测值是0.662787911775382

 

 

整理出231211_s_at探针组的PMMM强度为:

 

PM  MM

78  66

85  85

80  123

101  131

86  72

92  67

110  114

114  117

 

 

 

Detection.p.val的计算过程:

 

一、默认值:

tao=0.015

sat=46000

alpha1=0.05

alpha2=0.065

 

MM中有MM>sat的值,则把该项数据去掉

筛选后:

PM  MM

78  66

85  85

80  123

101  131

86  72

92  67

110  114

114  117

 

二、计算X = (PM - MM) / (PM + MM) - tao

 

X

0.06833333333333333

-0.015

-0.22682266009852214

-0.1443103448275862

0.07360759493670886

0.14223270440251573

-0.032857142857142856

-0.027987012987012987

 

X中有等于0的数据,则把该项数据去掉

 

三、wilcox算法

 

1X的数据取绝对值

 

ABSX            XIDX

0.06833333333333333    1

0.015             2

0.22682266009852214      3

0.1443103448275862      4

0.07360759493670886      5

0.14223270440251573      6

0.032857142857142856    7

0.027987012987012987      8

 

 

2ABSX按照升序排序

 

ABSX             排名     XIDX

0.015              1       2

0.027987012987012987   2       8

0.032857142857142856   3       7

0.06833333333333333     4       1

0.07360759493670886     5       5

0.14223270440251573   6       6

0.1443103448275862     7       4

0.22682266009852214         8       3

 

注意:如果ABSX中出现相同的数,那么它们的排名取平均值。如下面这个例子:

ABSX       ABSX       排名         排名

2         0.5         1         (1+2)/2=0.5

1           0.5         2         平均值 (1+2)/2=0.5

2   ------->    1          3   ------->  3

0.5        2          4         (4+5)/2=4.5

0.5        2          5         (4+5)/2=4.5

 

3)排名按照XIDX排回原来的位置

 

排名   XIDX

4     1

1     2

8     3

7     4

5     5

6     6

3     7

2     8

 

4)排名按照X取正负号

 

R

4

-1

-8

-7

5

6

-3

-2

 

5STATISTIC = (R中大于0的值相加)

STATISTIC=4+5+6=15

 

6

nx=探针对数=8

z     = STATISTIC - (nx * (nx + 1))/4 = -3

SIGMA = sqrt((nx * (nx + 1) * (2 * nx + 1)) / 24 )=sqrt(51)=7.14142842854285

PVAL  = pnorm_approx(z / SIGMA)=0.33721208822461746

PVAL    = 1 - PVAL=0.6627879117753825

 

因为PVAL>alpha2,所以探针组231211_s_at的检测值为"P"

 

posted @ 2015-05-22 14:51  洗浄  阅读(438)  评论(0编辑  收藏  举报