摘要:
接前一篇:用R和BioConductor进行基因芯片数据分析(四):芯片内归一化 上次进行了芯片内的归一化,但是我们的数据来自于10张芯片,为了让这10张芯片之间有可比性,需要进行芯片间归一化。 具体原理就不介绍了。 这里用到Bioconductor的一个package,叫做limma,以及其中的函数normalizeBetweenArrays() 由于normalizeBetweenAr... 阅读全文
摘要:
接前一篇: 用R和BioConductor进行基因芯片数据分析(三):计算median 归一化是从normalization翻译过来的。归一化的目的是使各次/组测量或各种实验条件下的测量可以相互比较,消除测量间的非实验差异。非实验差异可能来源于样品制备,点样,杂交过程,杂交信号处理等。 归一化的方法有很多,对于寡聚核苷酸芯片(单通道,以Affymetrix为代表)和cDNA芯片(双通道,红绿染... 阅读全文
摘要:
接前一篇: http://www.cnblogs.com/emanlee/archive/2012/12/05/2803144.html 我们已经知道要分析的数据对每个基因有3个重复测定值,经过缺失值填充后,每个基因都有3个可用值。 这一步很简单,就是取这3个值的中位数,即median。 方法很多,在excel中可以用median函数; 在R中以下代码进行操作: get_media... 阅读全文
摘要:
以下分析用到的数据可以在这里(http://dl.getdropbox.com/u/308058/blog/raw_data_3_replicates.txt )下载,这个数据来自关于基因对蝴蝶迁移性的研究,样本是20个蝴蝶个体,其中10个是当地固有个体(old),另外10个是新迁入的个体(new),old和new个体两两随机配对,分别用不同颜色染料(波长分别为555和647nm)标记后,在同一张基因芯片上杂交;此外,每个基因在每张芯片上都重复点样3次,因此此数据是有3个replicates及10张芯片的双通道芯片。数据是样点的信号强度值,没有经过标准化处理的。拿到数据你会看到许多”NA”,这 阅读全文
摘要:
R是开源的统计计算和作图语言,与S语言很相似。R的语法与其他语言很相似,功能很强大,可以到这里看看截图。主页是 http://www.r-project.org/ 可以点击这里下载R,这里有很权威的英文教程。本站提供几本中文教程(pdf)的打包下载,更多的随便搜索一下就可以找到。 BioConductor是建立在R语言环境上的生物芯片数据和基因组数据分析软件包,主页是 http://www... 阅读全文
摘要:
bioconductor 包的安装安装R,并启动R。 > source("http://bioconductor.org/biocLite.R") > biocLite() Using R version 2.10.0 (R-devel), biocinstall version ... 阅读全文