随笔分类 -  生物信息学

摘要:导出Feature/OTU表 wget -O feature-table.qza https://data.qiime2.org/2017.7/tutorials/exporting/feature-table.qza qiime tools export \ feature-table.qza \ 阅读全文
posted @ 2017-09-15 17:30 弗雷赛斯 阅读(1698) 评论(0) 推荐(0) 编辑
摘要:导入带质量值的测序数据 地球微生物组标准混样单端数据 “EMP protocol” multiplexed single-end fastq 此类数据标准包括两个文件,扩展名均为fastq.gz,一个是barcode文件,一个是样品混样测序文件。 # 建样品目录 mkdir -p emp-singl 阅读全文
posted @ 2017-09-15 14:16 弗雷赛斯 阅读(4995) 评论(0) 推荐(0) 编辑
摘要:QIIME2是微生物组分析流程QIIME(截止17.7.13被引7771次)的全新版(不是升级版),采用python3全新编写,并于2018年1月全面接档QIIME,是代表末来的分析方法标准(大牛们制定方法标准,我们跟着用就好了)。 安装 安装方法比较简单,参照官网:https://docs.qii 阅读全文
posted @ 2017-09-15 08:51 弗雷赛斯 阅读(2603) 评论(0) 推荐(1) 编辑
摘要:GEO数据库 GEO数据库隶属于NCBI,是最大最全面的基因表达数据库,主要是芯片和转录组测序数据。除储存数据外,也提供一些数据挖掘工具,因此利用好这个数据库,没有实验,没有自己的数据也能发好文章! https://www.ncbi.nlm.nih.gov/geo/ SRA文件的存放 从NCNI的这 阅读全文
posted @ 2017-09-06 13:51 弗雷赛斯 阅读(3698) 评论(0) 推荐(0) 编辑
摘要:(green) short pairwise alignment / detailed edit model; (yellow) database search / divergent homology detection; (red) whole genome alignment / alignm 阅读全文
posted @ 2017-09-05 00:23 弗雷赛斯 阅读(1145) 评论(0) 推荐(0) 编辑
摘要:一般情况下,从Illumina平台上得到的测序,其数据格式是Fastq格式,可以称之为原始数据(Raw data)。事实上直接的下机数据是显微拍摄得到的图像信息。但是一般都会用Bcl2Fastq软件将图像信息转化成Fastq文件。 如果测序是SE:则只有一个fastq文件,如果是PE测序,则得到两个 阅读全文
posted @ 2017-09-04 23:16 弗雷赛斯 阅读(3843) 评论(1) 推荐(0) 编辑
摘要:分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们获得了OTU序列的进化分析、同时计算Alpha和Beta多样性值。 本节是最后一节,我们对物种进行分类统计,筛选高丰度结果用于进化树展示,和其它用于R统计分析的结果生成 19. 按物种分类级别分类汇总 OTU表中最重要的 阅读全文
posted @ 2017-08-24 01:14 弗雷赛斯 阅读(1710) 评论(0) 推荐(0) 编辑
摘要:绘制Alpha多样性线箱图 绘图和统计全部为R语言,建议复制代码,在Rstuido中运行,并设置工作目录为存储之前分析结果文件的result目录 # 运行前,请在Rstudio中菜单栏选择“Session - Set work directory -- Choose directory”,弹窗选择之 阅读全文
posted @ 2017-08-23 21:54 弗雷赛斯 阅读(3435) 评论(0) 推荐(0) 编辑
摘要:分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们的OTU获得了物种注释,并学习OTU表的各种操作————添加信息,格式转换,筛选信息。 接下来我们学习对OTU序列的进化分析、同时计算Alpha和Beta多样性值。 16. 进化树构建 进化树是基于多序列比对的结果,可展 阅读全文
posted @ 2017-08-23 21:54 弗雷赛斯 阅读(2240) 评论(0) 推荐(0) 编辑
摘要:本节课程,需要先完成《扩增子分析解读》系列之前的操作 1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类 4去嵌合体 非细菌序列 生成代表性序列和OTU表 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们学习了 阅读全文
posted @ 2017-08-23 21:31 弗雷赛斯 阅读(6555) 评论(0) 推荐(0) 编辑
摘要:本节课程,需要先完成 扩增子分析解读1质控 实验设计 双端序列合并 2提取barcode 质控及样品拆分 切除扩增引物 3格式转换 去冗余 聚类 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们制作了Usearch要求格 阅读全文
posted @ 2017-08-22 00:54 弗雷赛斯 阅读(4926) 评论(0) 推荐(0) 编辑
摘要:本节课程,需要完成扩增子分析解读1质控 实验设计 双端序列合并和2提取barcode 质控及样品拆分 切除扩增引物 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们提取barcode,质控及样品拆分,切除扩增引物,经历了 阅读全文
posted @ 2017-08-21 19:35 弗雷赛斯 阅读(2861) 评论(0) 推荐(0) 编辑
摘要:本节课程,需要完成扩增子分析解读1质控 实验设计 双端序列合并 先看一下扩增子分析的整体流程,从下向上逐层分析 分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们拿到了双端数据,进行了质控、并对实验设计进行了填写和检查、最后将双端数据合并为单个文件进行下游分析。 接下来 阅读全文
posted @ 2017-08-21 06:27 弗雷赛斯 阅读(5814) 评论(0) 推荐(0) 编辑
摘要:通过 conda 安装 qiime 1后,在执行join_paired_ends.py时报错: burrito.util.ApplicationNotFoundError: Cannot find fastq-join. Is it installed? Is it in your path? 这是 阅读全文
posted @ 2017-08-21 04:30 弗雷赛斯 阅读(1627) 评论(0) 推荐(0) 编辑
摘要:本文采用目前最主流的扩增子测序数据类型HiSeq2500 PE250类型数据为例,结合目前主流方法QIIME+USearch定制的分析流程。本课程中所需的测序数据、实验设计和课程分析生成的中间文件,均可以直去百度云下载。链接:http://pan.baidu.com/s/1hs1PXcw 密码:y3 阅读全文
posted @ 2017-08-21 04:21 弗雷赛斯 阅读(5419) 评论(0) 推荐(0) 编辑
摘要:# 下载最新版QIIME 2 docker pull qiime2/core:2017.7 # 测试是否安装成功 docker run -t -i -v $(pwd):/mnt/hgfs/2017 qiime2/core:2017.7 qiime # 启动docker命令行,挂载目录至/mnt/hg 阅读全文
posted @ 2017-08-20 06:56 弗雷赛斯 阅读(2038) 评论(0) 推荐(0) 编辑
摘要:任务列表 比对软件 hisat2的用法 下载index文件 比对、排序、索引 质量控制 载入IGV,截图几个基因 hisat2的用法 本作业是比对到基因组,所以使用gapped or splices mapper,此流程已经更新。TopHat首次被发表已经是7年前,STAR的比对速度是TopHat的 阅读全文
posted @ 2017-08-16 22:18 弗雷赛斯 阅读(1982) 评论(0) 推荐(0) 编辑
摘要:任务列表 1.在UCSC下载hg19参考基因组; 2.从gencode数据库下载基因注释文件,并且用IGV去查看感兴趣的基因的结构,比如TP53,KRAS,EGFR等等。 3.截图几个基因的IGV可视化结构 4.下载ENSEMBL,NCBI的gtf,也导入IGV看看,截图基因结构 5.了解IGV常识 阅读全文
posted @ 2017-08-11 01:00 弗雷赛斯 阅读(7886) 评论(0) 推荐(0) 编辑
摘要:sra文件转换为fastq格式 fastq-dump -h --split-3 也就是说如果SRA文件中只有一个文件,那么这个参数就会被忽略。如果原文件中有两个文件,那么它就会把成对的文件按*_1.fastq,*_2.fastq这样分开。如果还出现了第三个文件,就意味着这个文件本身是未成配对的部分。 阅读全文
posted @ 2017-08-08 00:37 弗雷赛斯 阅读(5911) 评论(0) 推荐(0) 编辑
摘要:在使用FastQC之后,如果我们发现了一些问题(序列质量不高),那么我们该使用什么样的工具,去解决这些问题呢? fastx Toolkit是包含处理fastq/fasta文件的一系列的工具,它是基于java开发的,我们高通量测序最常用到的是使用这个软件进行reads的裁剪(trim) FASTQ-t 阅读全文
posted @ 2017-08-03 17:47 弗雷赛斯 阅读(1143) 评论(1) 推荐(0) 编辑

点击右上角即可分享
微信分享提示