随笔档案「2018年9月」 - 发那个太丢人

该文被密码保护。

posted @ 2018-09-30 11:42 发那个太丢人阅读(373) 评论(0) 推荐(0)

摘要：1）介绍来自NCBI的Gene Expression Omnibus（GEO）作为各种高通量实验数据的公共存储库。这些数据包括基于单通道和双通道微阵列的实验，测量mRNA，基因组DNA和蛋白质丰度；以及非阵列技术，如基因表达系列分析（SAGE）和质谱蛋白质组学数据。在GEO最基本的组织级别中，阅读全文

posted @ 2018-09-27 14:59 发那个太丢人阅读(1035) 评论(0) 推荐(0)

Gviz

摘要：1) Introduction 为了理解基因组数据，通常旨在在基因组浏览器中绘制这样的数据，以及各种基因组注释特征，例如基因或转录物模型，CpG岛，重复区域等。这些功能可以从ENSEMBL或UCSC等公共数据库中提取，也可以在内部生成或策划。许多当前可用的基因组浏览器在显示基因组注释数据方面做了合理阅读全文

posted @ 2018-09-27 11:17 发那个太丢人阅读(2058) 评论(0) 推荐(0)

用R包来下载sra数据

摘要：1）介绍我们用SRAdb library来对SRA数据进行处理。 SRAdb 可以更方便更快的接入 metadata associated with submission, 包括study, sample, experiment, and run. SRAdb 包通过 NCBI SRA数据库中的m 阅读全文

posted @ 2018-09-21 17:05 发那个太丢人阅读(3584) 评论(0) 推荐(0)

Analyzing Microarray Data with R

摘要：1) 熟悉CEL file 从 NCBI GEO (http://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE24460)下载GSE24460. 将得到一个 GSE24460_RAW.tar 文件，解压。产生CEL文件，包含各种信息。如果不是从CEL 阅读全文

posted @ 2018-09-20 15:49 发那个太丢人阅读(1296) 评论(0) 推荐(0)

IRanges package

摘要：1）介绍在分析序列时，我们通常对特定的连续子序列感兴趣。例如，a矢量可以被认为是按字母顺序排列的小写字母序列。我们将第一个五个字母（a到e）称为连续的子序列，而仅包含元音的子序列不会是连续的。分析任务仅关注区域的几何形状，而忽略基础序列值的情况并不少见。索引列表是选择子序列的简单方法。然阅读全文

posted @ 2018-09-20 10:14 发那个太丢人阅读(310) 评论(0) 推荐(0)

airway之workflow

摘要：1）airway简介在该workflow中，所用的数据集来自RNA-seq，气道平滑肌细胞(airway smooth muscle cells )用氟美松（糖皮质激素，抗炎药）处理。例如，哮喘患者使用糖皮质激素来减少呼吸道炎症，在该实验设计中，4种细胞类型(airway smooth muscl 阅读全文

posted @ 2018-09-19 10:12 发那个太丢人阅读(2533) 评论(0) 推荐(0)

序列比对之Biostrings包

摘要：基本概念 Biostrings包很重要的3个功能是进行Pairwise sequence alignment 和Multiple sequence alignment及 Pattern finding in a sequence 序列比对一般有2个过程： 1）构建计分矩阵公式（the scoring 阅读全文

posted @ 2018-09-18 11:05 发那个太丢人阅读(2524) 评论(1) 推荐(0)

序列下载及处理之seqinr包

摘要：缺点：需要联网，经常出错，不是操作问题而是因为网络问题安装 ###Retrieving a sequence and write into FASTA file### 1) 选择要去fetch序列的数据库(这里已genebank为例) 2）一旦选择好了数据库，用query信息进行收索 3）查看qu 阅读全文

posted @ 2018-09-17 12:01 发那个太丢人阅读(1542) 评论(0) 推荐(0)

edgeR

摘要：1）简介 edgeR作用对象是count文件，rows 代表基因，行代表文库，count代表的是比对到每个基因的reads数目。它主要关注的是差异表达分析，而不是定量基因表达水平。 edgeR works on a table of integer read counts, with rows co 阅读全文

posted @ 2018-09-14 15:43 发那个太丢人阅读(4604) 评论(0) 推荐(0)

DESeq2包

摘要：1）简介： DESeq2-package： for differential analysis of count data（对count data 做差异分析） 2）安装 if("DESeq2" %in% rownames(installed.packages()) == FALSE) {sourc 阅读全文

posted @ 2018-09-13 17:12 发那个太丢人阅读(2009) 评论(0) 推荐(0)

clusterProﬁler包

摘要：1）enrichGO：（GO富集分析）描述：GO Enrichment Analysis of a gene set. Given a vector of genes, this function will return the enrichment GO categories after FDR 阅读全文

posted @ 2018-09-13 10:08 发那个太丢人阅读(994) 评论(0) 推荐(0)

常用数据库ID格式

摘要：转自：http://www.biotrainee.com/thread-411-1-1.html 常用数据库 ID Ensembl stable IDs Ensembl stable ID 的结构是根据不同物种设置的前缀, 加上数据所指的类型, 如基因蛋白质, 再加上一系列的数字. 有的时候可以有不阅读全文

posted @ 2018-09-12 19:49 发那个太丢人阅读(1483) 评论(0) 推荐(0)

KEGG下载某物种最新的版本信息（斑马鱼,蜜蜂为例）

该文被密码保护。

posted @ 2018-09-12 18:04 发那个太丢人阅读(621) 评论(0) 推荐(1)

kegg富集分析之：KEGGREST包（9大功能）

摘要：这个包依赖极有可能是这个：https://www.kegg.jp/kegg/docs/keggapi.html ，如果可以看懂会很好理解由于KEGG数据库分享数据的策略改变，因此KEGG.db包不在能用，推荐KEGGREST包 But a number of years ago,KEGG chan 阅读全文

posted @ 2018-09-12 15:01 发那个太丢人阅读(9855) 评论(0) 推荐(0)

KEGG数据库介绍

摘要：1、KEGG简介 KEGG 数据库于 1995 年由 Kanehisa Laboratories 推出 0.1 版，目前发展为一个综合性数据库，其中最核心的为 KEGG PATHWAY 和 KEGG ORTHOLOGY 数据库。在 KEGG ORTHOLOGY 数据库中，将行使相同功能的基因聚在一起阅读全文

posted @ 2018-09-12 11:13 发那个太丢人阅读(9803) 评论(0) 推荐(1)

topGO

摘要：前面我们讲过GO.db这个包，现在接着延伸topGO包，该包是用来协助GO富集分析 1）安装 2）使用方法该包主要有三个使用步骤： 2.1、Data preparation:准备数据集，用于构建 topGOdata.对象。 2.1.1、包括gene标识符(List of genes identiﬁ 阅读全文

posted @ 2018-09-11 09:59 发那个太丢人阅读(2484) 评论(0) 推荐(0)

GO.db

摘要：相似的基因在不同物种中，其功能往往保守的。显然，需要一个统一的术语用于描述这些跨物种的同源基因及其基因产物的功能，否则，不同的实验室对相同的基因的功能的描述不同，将极大限制学术的交流。而 Gene Ontology (GO) 项目正是为了能够使对各种数据库中基因获基因产物功能描述相一致的努力结果。一阅读全文

posted @ 2018-09-10 10:35 发那个太丢人阅读(2401) 评论(0) 推荐(0)

Bioconductor应用领域之基因芯片

摘要：引用自https://mp.weixin.qq.com/s?__biz=MzU4NjU4ODQ2MQ==&mid=2247484662&idx=1&sn=194668553f954e231f4526f5c944a195&chksm=fdf84cb4ca8fc5a2c0e8355377f9d6abdc 阅读全文

posted @ 2018-09-10 09:08 发那个太丢人阅读(1661) 评论(0) 推荐(0)

org.Hs.eg.db包简介(转换NCBI、ensemble等数据库中基因ID，symbol等之间的转换)

摘要：1）安装载入 if("org.Hs.eg.db" %in% rownames(installed.packages()) == FALSE) {source("http://bioconductor.org/biocLite.R");biocLite("org.Hs.eg.db")}suppress 阅读全文

posted @ 2018-09-09 10:15 发那个太丢人阅读(13567) 评论(0) 推荐(0)

Bioconductor的历史

摘要：Bioconductor 1）简介Bioconductor项目始于2001年达纳法伯癌症研究所。高科技产业多学科研究基金会为该项目提供支持。 2）目的Bioconductor项目的广泛目标是在计算生物学中实现良好的数据分析和推理实践，并提供一个平台，使科学家（生物学家和统计学家）能够开发和快速部署阅读全文

posted @ 2018-09-08 21:33 发那个太丢人阅读(303) 评论(0) 推荐(0)

导航

09 2018 档案