随笔分类 - 数据库使用
摘要:David数据库也是进行GO过程注释、pathway注释的数据库。 注释步骤: upload->submit list(选择gene_symbol)->list->select species
阅读全文
摘要:GTEx database:该数据库是健康人贡献的组织的RNASeq的数据。还有snp信息。将snp信息与gene的表达水平结合起来。 donor: donor贡献的tissue。 gene表达水平(用FPKM表示gene的表达水平)受其周围snp的影响,这样的gene叫做egene。这样的snp叫
阅读全文
摘要:1. 输入mouse的gene symble时,不能输入大写的gene symble。 比如:Sept8可以,SEPT8不可以。提示error:没有map。 比如:FBP1,提示no mapping。Fbp1,OK。 总结:小鼠和人的gene symble在大小写是不同的。全部大写的gene sym
阅读全文
摘要:在R中,p.adjust可计算FDR值。参考网址:https://stat.ethz.ch/R-manual/R-devel/library/stats/html/p.adjust.html 多重检验都得算q-value,即FDR值。原因如下: 参考我的博文:https://www.cnblogs.
阅读全文
摘要:置换检验 参考网址:https://www.plob.org/article/3176.html 置换检验(permutation test):利用样本数据的全(或随机)排列,进行统计推断的方法。特别适用于总体分布未知的小样本资料。 结合GSEA,解释permutation test: 首先,有两种
阅读全文
摘要:GO官网:http://geneontology.org/docs/ontology-documentation/ 先说Ontology的含义: Ontology:某领域内的知识的正式、规范的描述。它通常由一些class/term/concept之间的关系组成。 Gene Ontology主要描述了
阅读全文
摘要:参考资料来源: http://software.broadinstitute.org/gsea/doc/GSEAUserGuideFrame.html https://cloud.tencent.com/developer/article/1426130 GSEA图的理解: 含义概述: 竖线表示:某
阅读全文
摘要:如果转载,请注明出处。 GSEA、David与KEGG、GO数据库的区别: 1.KEGG数据库、GO数据库是知识库。它们记录了通路、生物学过程等的信息。 2.GSEA、David是做富集分析的数据库。它们使用KEGG、GO数据库中的信息,再结合你输入的基因列表,对输入基因列表进行富集分析,给出结果(
阅读全文
摘要:对于生物信息学知识的掌握,大体可以分为三重境界: 讲解了3代生物功能富集检验方法,主要降解了GSEA方法的使用和优缺点。 参考资料:https://zhuanlan.zhihu.com/p/20901089 讲解了pathway注释和基因富集的不同,以及各自的优缺点: 参考资料:https://ww
阅读全文
摘要:KEGG mapper: 输入:cufdiff生成的差异基因列表(log2fold_change的绝对值>1, pvalue<0.01) 目的:在KEGG网站中,利用KEGG mapper工具进行pathway注释。 过程: 1. ID转换:将gene symbol转换为uniprobID 方法:利
阅读全文
摘要:gene symbol: TP53 gene ID:7157。Entrez Gene ID,它是目前国际上最权威的Gene ID编号! GENECODE:GENECODE来自Ensembl数据库。没有ID。它有gtf文件。 HGNC(人类基因命名委员会)只对人类基因进行命名。 HUGO Gene S
阅读全文