摘要:在使用clusterProfiler时,KEGG注释包,可以自定义。毕竟许多物种的数据库是不完善的。现在就自定义一个KEGG.db的包,用于KEGG注释。 第一步,先去上述官方地址找到自己研究的物种在KEGG数据里的3字符缩写,比如:人的缩写是hsa #安装Y叔的包, #安装创建KEGG数据库的包的
阅读全文
摘要:一、软件的官网(有些可能无法访问,比如sorceforce) 二、aconda官网 三、
阅读全文
摘要:https://www.jianshu.com/p/266c55c87978?utm_campaign=haruki $ bcftools index -t view.vcf.gz # 创建 .tbi 索引
阅读全文
摘要:https://blog.csdn.net/weixin_36140403/article/details/112674585
阅读全文
摘要:GATK 在官网中提供了resource bundle,里面包含了所需要的很多数据。目前提供FTP 和 Google Cloud bucket 2种下载方式,由于用不了Google,推荐使用FTP GATK官网推荐使用lftp工具进行访问ftp和下载数据,提前安装lftp,本次使用root 权限安装
阅读全文
摘要:http://events.jianshu.io/p/e646ed57fa61 https://www.jianshu.com/p/51edb6b23143
阅读全文
摘要:GEOquery 是 bioconductor 项目下的一个R包 官网:http://www.bioconductor.org/packages/release/bioc/html/GEOquery.html 下载安装: GEO 是由NCBI负责维护的一个数据库,期初是有芯片数据,后来增加了甲基化芯
阅读全文
摘要:下载安装 affy 包为 Bioconductor 之中一个用于数据预处理的包。 affy 包的功能只有一个:读取 affymetrix 的基因表达芯片数据,即CEL格式文件,然后处理成表达矩阵。 先解释以下为什么这个包叫这个名字,这是因为affy其实是一个生产芯片的公司,这个公司做的芯片所产生的的
阅读全文
摘要:何为功能富集分析? 功能富集分析是将基因或者蛋白列表分成多个部分,即将一堆基因进行分类,而这里的分类标准往往是按照基因的功能来限定的。换句话说,就是把一个基因列表中,具有相似功能的基因放到一起,并和生物学表型关联起来。 何为GO和KEGG? 为了解决将基因按照功能进行分类的问题,科学家们开发了很多基
阅读全文
摘要:setwd("GSE29431_RAW") # 进入目录 fileNames <- list.files() # 获取目录下的所有文件sapply(fileNames, gunzip) # 进行解压操作,fileNames是一个向量,gunzip是解压缩的函数,sapply()会依次将fileNames中的元素应用gunzip函数
阅读全文
摘要:将 html 转为 pdf :wkhtmltopdf wkhtmltopdf 是一个使用 webkit 网页渲染引擎开发的用来将 html 转成 pdf 的工具,可以跟多种脚本语言进行集成来转换文档。 官网:https://wkhtmltopdf.org/ github网址:https://gith
阅读全文
摘要:使用在线绘图工具 https://bioinfogp.cnb.csic.es/tools/venny/index.html http://www.biovenn.nl/index.php http://bioinformatics.psb.ugent.be/webtools/Venn/ 使用 R 语
阅读全文
摘要:Circos官网 http://circos.ca 在线绘图工具 http://mkweb.bcgsc.ca/tableviewer/visualize/ Circos图的诞生 Circos图诞生于2009年,当时是作为一个绘图工具类的文章发表在Genome Research(最新IF:9.944)
阅读全文
摘要:GEO2R 是GEO数据库官方提供的一个工具,用于进行差异表达分析。 该工具实现的功能就是将GEO数据库中的数据导入到R语言中,然后进行差异分析,本质是通过以下两个bioconductor上的R包实现的。 -- GEOquery:用于自动下载GEO数据,并读取到R环境中 -- limma:一个经典的
阅读全文
摘要:网络图(Network)看似复杂,其实构成非常简单,网络图是一种图解模型,形状如同网络,故称网络图,由节点(node)和连线(edge)两个因素组成的。其中 node 又分为 source node(源节点)和 target node(目标节点)两个因素组成的。这里的 node 就是我们的基因,ed
阅读全文
摘要:将fasta文件线性化处理 将fastq文件线性化处理
阅读全文
摘要:http://master.bioconductor.org/packages/3.9/bioc/html/Glimma.html 安装
阅读全文
摘要:E-value: The E-value provides information about the likelihood that a given sequence match is purely by chance. The lower the E-value, the less likely
阅读全文
摘要:Surrogate Variable Analysis http://www.bioconductor.org/packages/release/bioc/html/sva.html
阅读全文
摘要:https://www.jianshu.com/p/4519d2e64a49
阅读全文