GEOquery
摘要:1)介绍 来自NCBI的Gene Expression Omnibus(GEO)作为各种高通量实验数据的公共存储库。 这些数据包括基于单通道和双通道微阵列的实验,测量mRNA,基因组DNA和蛋白质丰度;以及非阵列技术,如基因表达系列分析(SAGE)和质谱蛋白质组学数据。 在GEO最基本的组织级别中,
阅读全文
Gviz
摘要:1) Introduction 为了理解基因组数据,通常旨在在基因组浏览器中绘制这样的数据,以及各种基因组注释特征,例如基因或转录物模型,CpG岛,重复区域等。这些功能可以从ENSEMBL或UCSC等公共数据库中提取,也可以在内部生成或策划。许多当前可用的基因组浏览器在显示基因组注释数据方面做了合理
阅读全文
用R包来下载sra数据
摘要:1)介绍 我们用SRAdb library来对SRA数据进行处理。 SRAdb 可以更方便更快的接入 metadata associated with submission, 包括study, sample, experiment, and run. SRAdb 包通过 NCBI SRA数据库中的m
阅读全文
Analyzing Microarray Data with R
摘要:1) 熟悉CEL file 从 NCBI GEO (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE24460)下载GSE24460. 将得到一个 GSE24460_RAW.tar 文件,解压。产生CEL文件,包含各种信息。 如果不是从CEL
阅读全文
IRanges package
摘要:1)介绍 在分析序列时,我们通常对特定的连续子序列感兴趣。 例如,a矢量可以被认为是按字母顺序排列的小写字母序列。 我们将第一个五个字母(a到e)称为连续的子序列,而仅包含元音的子序列不会是连续的。 分析任务仅关注区域的几何形状,而忽略基础序列值的情况并不少见。 索引列表是选择子序列的简单方法。 然
阅读全文
airway之workflow
摘要:1)airway简介 在该workflow中,所用的数据集来自RNA-seq,气道平滑肌细胞(airway smooth muscle cells )用氟美松(糖皮质激素,抗炎药)处理。例如,哮喘患者使用糖皮质激素来减少呼吸道炎症,在该实验设计中,4种细胞类型(airway smooth muscl
阅读全文
序列比对之Biostrings包
摘要:基本概念 Biostrings包很重要的3个功能是进行Pairwise sequence alignment 和Multiple sequence alignment及 Pattern finding in a sequence 序列比对一般有2个过程: 1)构建计分矩阵公式(the scoring
阅读全文
序列下载及处理之seqinr包
摘要:缺点:需要联网,经常出错,不是操作问题而是因为网络问题 安装 ###Retrieving a sequence and write into FASTA file### 1) 选择要去fetch序列的数据库(这里已genebank为例) 2)一旦选择好了数据库,用query信息进行收索 3)查看qu
阅读全文
edgeR
摘要:1)简介 edgeR作用对象是count文件,rows 代表基因,行代表文库,count代表的是比对到每个基因的reads数目。它主要关注的是差异表达分析,而不是定量基因表达水平。 edgeR works on a table of integer read counts, with rows co
阅读全文
DESeq2包
摘要:1)简介: DESeq2-package: for differential analysis of count data(对count data 做差异分析) 2)安装 if("DESeq2" %in% rownames(installed.packages()) == FALSE) {sourc
阅读全文
clusterProfiler包
摘要:1)enrichGO:(GO富集分析) 描述:GO Enrichment Analysis of a gene set. Given a vector of genes, this function will return the enrichment GO categories after FDR
阅读全文
常用数据库ID格式
摘要:转自:http://www.biotrainee.com/thread-411-1-1.html 常用数据库 ID Ensembl stable IDs Ensembl stable ID 的结构是根据不同物种设置的前缀, 加上数据所指的类型, 如基因蛋白质, 再加上一系列的数字. 有的时候可以有不
阅读全文
kegg富集分析之:KEGGREST包(9大功能)
摘要:这个包依赖极有可能是这个:https://www.kegg.jp/kegg/docs/keggapi.html ,如果可以看懂会很好理解 由于KEGG数据库分享数据的策略改变,因此KEGG.db包不在能用,推荐KEGGREST包 But a number of years ago,KEGG chan
阅读全文
KEGG数据库介绍
摘要:1、KEGG简介 KEGG 数据库于 1995 年由 Kanehisa Laboratories 推出 0.1 版,目前发展为一个综合性数据库,其中最核心的为 KEGG PATHWAY 和 KEGG ORTHOLOGY 数据库。在 KEGG ORTHOLOGY 数据库中,将行使相同功能的基因聚在一起
阅读全文
topGO
摘要:前面我们讲过GO.db这个包,现在接着延伸topGO包,该包是用来协助GO富集分析 1)安装 2)使用方法 该包主要有三个使用步骤: 2.1、Data preparation:准备数据集,用于构建 topGOdata.对象。 2.1.1、包括gene标识符(List of genes identifi
阅读全文
GO.db
摘要:相似的基因在不同物种中,其功能往往保守的。显然,需要一个统一的术语用于描述这些跨物种的同源基因及其基因产物的功能,否则,不同的实验室对相同的基因的功能的描述不同,将极大限制学术的交流。而 Gene Ontology (GO) 项目正是为了能够使对各种数据库中基因获基因产物功能描述相一致的努力结果。一
阅读全文
Bioconductor应用领域之基因芯片
摘要:引用自https://mp.weixin.qq.com/s?__biz=MzU4NjU4ODQ2MQ==&mid=2247484662&idx=1&sn=194668553f954e231f4526f5c944a195&chksm=fdf84cb4ca8fc5a2c0e8355377f9d6abdc
阅读全文
org.Hs.eg.db包简介(转换NCBI、ensemble等数据库中基因ID,symbol等之间的转换)
摘要:1)安装载入 if("org.Hs.eg.db" %in% rownames(installed.packages()) == FALSE) {source("http://bioconductor.org/biocLite.R");biocLite("org.Hs.eg.db")}suppress
阅读全文
Bioconductor的历史
摘要:Bioconductor 1)简介Bioconductor项目始于2001年达纳法伯癌症研究所。 高科技产业多学科研究基金会为该项目提供支持。 2)目的Bioconductor项目的广泛目标是在计算生物学中实现良好的数据分析和推理实践,并提供一个平台,使科学家(生物学家和统计学家)能够开发和快速部署
阅读全文