附录2:CEL文件格式

一、版本3

 

 

描述

version

版本号,设为3

Cols

列数

Rows

行数

TotalX

Cols一样

TotalY

Rows一样

OffsetX

无用,设置为0

OffsetY

无用,设置为0

GridCornerUL

左上角的XY坐标

GridCornerUR

右上角的XY坐标

GridCornerLR

右下角的XY坐标

GridCornerLL

左下角的XY坐标

Axis-InvertX

无用,设置为0

Axis-InvertY

无用,设置为0

swapXY

无用,设置为0

DatHeader

DAT文件的头部,包含了cdf型号

Algorithm

用来生成CEL文件的算法

AlgorithmParameters

算法参数

[INTENSITY]

NumberCells

Cell的数目,等于Rows*Cols

CellHeader

X Y MEAN STDV NPIXELS

NA

这部分每一行是一个Cell的数据,包括CellX坐标、Y坐标、平均荧光强度值,方差、用了多少像素来计算这个平均值。共NumberCells

[MASKS]

NumberCells

Masked Cell的数目

CellHeader

X Y

NA

这部分每一行是一个Masked Cell的数据,包括Masked CellX坐标、Y坐标

[OUTLIERS]

NumberCells

Outlier Cell的数目

CellHeader

X Y

NA

这部分每一行是一个Outlier Cell的数据,包括Outlier CellX坐标、Y坐标

 

 

 

二、版本4

 

 

描述

数据类型

C语言读取方法

Magic number

幻数,设为64

int

fread_int32

Version number

版本号,设为4

int

Number of columns

列数

int

Number of rows

行数

int

Number of cells

Cell的数目,等于行数*列数

int

Header length

头部的长度

int

Header

头部

char,长度是Header length

fread

Algorithm name length

算法名的长度

int

fread_int32

Algorithm name

算法名

char,长度是Algorithm name length

fread_char

Algorithm parameters length

算法参数长度

int

fread_int32

Algorithm parameters

算法参数

char,长度是Algorithm parameters length

fread_char

Cell margin

计算Cell强度的余量

int

fread_int32

Number of outlier cells

Outlier Cell的数目

DWORD

fread_uint32

 

Number of masked cells

Masked Cell的数目

Number of sub-grids

子网格的数目

int

fread_int32

Cell entries

每个Cell的数据包括intensitiesstddevnpixels,共Number of cellsCell

 

强度intensities

float

fread_float32

方差stddev

像素npixels

short

 

fread_int16

Masked entries

每个Masked Cell的数据包括X坐标、Y坐标,共Number of masked cellsMasked Cell

X

Y

Outlier entries

每个Outlier Cell的数据包括X坐标、Y坐标,共Number of outlier cellsOutlier Cell

X

Y

Sub-grid entries

每个Sub-grid的数据包括14项,共sub-gridsSub-grid 

row number

int

fread_int32

column number

upper left x coordinate in pixels

float

fread_float32

 upper left y coordinate in pixels

upper right x coordinate in pixels

upper right x coordinate in pixels

 lower left x coordinate in pixels

 lower left y coordinate in pixels

lower right x coordinate in pixels

 lower right x coordinate in pixels

left cell position

int

fread_int32

 top cell position

right cell position

bottom cell position

 

 

 

三、版本1

 

 

描述

数据类型

C语言读取方法

Magic number

幻数,设为59

unsigned char

fread_be_uchar

Version

版本号,设为1

n_data_groups

数据的组数

int

fread_be_int32

data_type_id_len

数据类型编号的长度

fread_be_int32

data_type_id

数据类型编号,

char ,长度是data_type_id_len

fread_be_char

unique_file_id_len

文件编号长度

int

fread_be_int32

unique_file_id

文件编号

char ,长度是unique_file_id_len

fread_be_char

Date_time_len

日期长度

int

fread_be_int32

Date_time

日期

char,长度是Date_time_len

fread_be_uint16

locale_len

 

int

fread_be_int32

locale

 

char,长度是locale_len

fread_be_int32

 

n_name_type_value

name_type_value的长度

int

name_type_value,每个name_type_value的数据有6项,共n_name_type_valuename_type_valuenameaffymetrix-array-type的时候,对应的value就是CDF型号了

name_len

int

fread_be_int32

name

char,长度为name_len

fread_be_uint16

value_len

int

fread_be_int32

value

char,长度为value_len

fread_be_char

type_len

int

fread_be_int32

type

char,长度为type_len

fread_be_uint16

n_parent_headers(决定了某个方法的递归次数)

 

int

fread_be_int32

file_position_nextgroup

 

unsigned int

fread_be_uint32

file_position_first_data

 

n_data_sets

 

int

fread_be_int32

data_group_name_len

 

int

fread_be_int32

data_group_name

 

char,长度为data_group_name_len

fread_be_uint16

file_pos_first

 

unsigned int

fread_be_uint32

data_set_name_len

 

int

fread_be_int32

data_set_name

 

char,长度为data_set_name_len

fread_be_uint16

n_name_type_value

 

int

fread_be_int32

ncols

探针数目

unsigned int

fread_be_uint32

col_name_type_value_name_len

 

int

fread_be_int32

col_name_type_value_name

 

char,长度为col_name_type_value_name_len

fread_be_uint16

col_name_type_value_type

 

unsigned char

fread_be_uchar

col_name_type_value_size

 

int

fread_be_int32

data_set,存储探针强度的数据集,根据col_name_type_value_type的值确定data_set是哪种数据类型。data_set共包含ncols个数据

col_name_type_value_type0

char

fread_be_char

col_name_type_value_type1

unsigned char

fread_be_uchar

col_name_type_value_type2

short

fread_be_int16

col_name_type_value_type3

unsigned short

fread_be_uint16

col_name_type_value_type4

int

fread_be_int32

col_name_type_value_type5

unsigned int

fread_be_uint32

col_name_type_value_type6

float

fread_be_float32

posted @ 2015-05-22 15:36  洗浄  阅读(947)  评论(0编辑  收藏  举报