摘要:
今天在做基因的聚类分析,碰到了意想不到的情况。library('gplots') mydist = function(x){ dist(x,method = 'euclidean') } myclust = function(y){ hclust(y,method='ward') } mycol = greenred(24) HM = heatmap.2(Exp_Data_Diff_Max_Probes, scale = 'row', distfun=mydist, hclustfun=myclust, ... 阅读全文
2013年4月4日
2013年4月3日
摘要:
电脑是win7 & ubuntu 双系统。今天把windows的硬盘重新分了一下区,结果发现原本有win7硬盘的media文件夹里面什么都没有了,于是查找网上资料,得知需要重新挂载硬盘。sudo fdisk -l #查看分区信息sudo su #进入根用户(sudo是没有权利的)#make directory under 'media'mkdir /media/Researchmkdir /media/C_Diskmkdir /media/Non_Study#mount the disk to the media foldermount /dev/sda5 /media 阅读全文
2013年3月30日
摘要:
library('Biobase')ESET = new('ExpressionSet', exprs = expressiondata)pData(ESET) = phenoDatafData(ESET) = featureData只要事先准备号expressiondata, phenoData, 以及featureData即可~ 阅读全文
2013年3月28日
摘要:
Python 中的raw_input 函数在需要用户与计算机交互时非常有用,其实R 里面也一直有一个类似的函数:readline例如,我现在做出了一个图,想要在图上面找到一个值来决定我在什么地方分割。而实事实上,如果写成函数的话,又必须每次都要更新不同的值,如果此时能够有readline的话,我们就可以直接看着图来进行确认:我使用下面的代码进行尝试:这样,最终经过三次尝试,我选定0.3作为分割点,把GO_ON改为‘yes',这样程序继续进行。 GO_ON = 'no' while (GO_ON != 'yes'){ NSF_Cut = as.numeri 阅读全文
2013年3月8日
摘要:
在分析大规模数据时使用apply往往比for循环快,但是,很难知道apply到底需要多长时间才能够把数据跑完。办法很简单:apply(matrix,1,function(x){TT = t.test(x)print(which(matrix [,1] == x[1])return(TT$p.value)})这里面,加一句print语句即可! 阅读全文
2013年3月2日
摘要:
R中有很多绘制venn diagram的函数,包括limma中的vennDiagram,gplot中的venn,不过这两种函数的缺点是1. 非彩色2. 不能够按照比例绘制venneuler函数绘制出来的图不够精细,而且只是显示出集合的名称,没有写明各子集、交集都是多少数量。搜索半天,终于发现R中有一种不错的文氏图绘制函数:VennDiagram!首先install.packages('VennDiagram')安装即可然后setwd('') #你需要的目录 library('VennDiagram')VD = venn.diagram(width 阅读全文
2013年2月28日
摘要:
ls函数是R非常常用的函数,一般用法即:ls(),返回处于现在名空间的对象名称我在写函数的时候,希望能够避免重复载入文件,这样可以节省时间,于是写出函数if ('document' %in% ls()) {mydata = document}else mydata = read.table(....)但是却发现,函数内的ls()只是能够列出函数空间内的对象名称,而非函数外的。很简单,只需要ls(pos = 1) 就可以改变环境,从而列出现在工作的R环境中的对象。 阅读全文
2012年10月19日
摘要:
生物信息学中经常使用R 来画图,而R画heatmap的功能是非常强大的。通常,我的习惯是使用gplots包中的heatmap.2函数来进行画图。不过这个函数中不能对聚类分析(clustering)到方法进行调整,于是,小小写一段代码即能使用不同的聚类分析方法来对heatmap进行聚类整合。 1 # There are 7 methods to make cluster in the function hclust in R 2 Cluster_Method<-c( "ward", "single", "complete", &q 阅读全文
2012年10月18日
摘要:
以前经常看到别人写技术博客,感觉是一种很好的分享知识,同时也是对自己知识的一种不错的总结。决定从现在开始写一些博客,一来能够总结自己工作学习中遇到的好的技巧、套路,二来也能和更多的志同道合的朋友们交流。本人现为生物信息学菜鸟,主要分析工具为R、shell,均为菜鸟级别,将来想要学习perl和python,另外也需要对统计学和数据挖掘有更进一步的了解。这篇博客就将从现在开始记录我在工作学习中悟出的技巧、套路以及思想。总之,希望这篇博客能够成为记录自己再这个领域中从菜鸟到老鸟,在到高手的过程! 阅读全文