随笔分类 -  生物信息学

摘要:1、下载fastqc 2、解压 3、 给予执行权限,否则执行的时候会显示没有权限 cd FastQCchmod 755 fastqc 4、加入到PATH export PATH=/home/h/FastQC/:$PATH 4、加入到PATH 5、测试 fastqc --help 5、测试 使用例子 阅读全文
posted @ 2017-08-03 10:53 弗雷赛斯 阅读(4276) 评论(0) 推荐(0)
摘要:HISAT samtools HTSeq 阅读全文
posted @ 2017-08-03 02:05 弗雷赛斯 阅读(671) 评论(0) 推荐(0)
摘要:https://trace.ncbi.nlm.nih.gov/Traces/study/?acc=PRJNA323422 lne是perl的参数,效果是: perl接收你的键盘输入(用后面的代码)处理后,输出一个换行,然后等待接收下一个输入 perl -lne '$id=substr($_,0,6) 阅读全文
posted @ 2017-08-03 01:22 弗雷赛斯 阅读(806) 评论(0) 推荐(0)
摘要:sratookit 下载后解压 移动到专门安装生物信息软件的目录下 加入环境变量 测试 下载测试文件SRR390728,默认存放在家目录下的ncbi文件夹中 转换sra文件的套路: -O 指定输出路径 --gzip 指定输出格式为gzip压缩格式(fastqc软件可以直接识别gzip压缩的文件) - 阅读全文
posted @ 2017-08-03 00:30 弗雷赛斯 阅读(449) 评论(0) 推荐(0)
摘要:数据分析与解读 1. Data Cleaning 从原始数据(Raw Data)到干净数据(Clean Data)的过程,有人翻译成“数据清洗”,实在叫不习惯 Illumina测序仪下机的数据通常为Bcl格式,是将同一个测序通道(Lane)所有样品的数据混杂在一起的,所以公司一般不会提供Bcl文件。 阅读全文
posted @ 2017-08-03 00:29 弗雷赛斯 阅读(1609) 评论(0) 推荐(0)
摘要:在单菌基因组的组装结果中,N50和N90代表什么意思? 大于N50长度的序列占基因组总长的50%,大于N90长度的序列占基因组总长的90%。 1、N50和N90是基因组组装中常用的组装指标,其含义为,将序列按照长度从大到小排列,依次计算大于该序列长度的序列总长,找到序列总长度刚好大于基因组总长度的5 阅读全文
posted @ 2017-08-03 00:17 弗雷赛斯 阅读(1871) 评论(0) 推荐(0)
摘要:在微生物测序中,样本的准备从根本上是确保获得高质量DNA的前提,而样本准备也正是让众多微生物科研工作者感到困扰的重要一步。今天就给大家分类介绍一下常见的微生物样本类型及采样方法 微生物测序样本准备方法 医口样本类型 样本种类推荐生物学重复 肠道 粪便,粘膜 6, 推荐 10 液体 尿,血液,脑髓液, 阅读全文
posted @ 2017-08-03 00:14 弗雷赛斯 阅读(3932) 评论(0) 推荐(0)
摘要:Microbiota 微生物群 微生物群是指研究动植物体上共生或病理的微生物生态群体。微生物群包括细菌、古菌、原生动物、真菌和病毒。研究表明其在宿主的免疫、代谢和激素等方面非常重要。近义词Microbiome微生物组即包括微生物,又包括其基因组 Microbiota 微生物群 微生物群是指研究动植物 阅读全文
posted @ 2017-08-03 00:13 弗雷赛斯 阅读(1232) 评论(0) 推荐(0)
摘要:扩增子常见问题 01 实验室检测的DNA浓度很高,送到公司检测之后浓度却比较低呢? 1、老师在实验室多采用Nanodrop对DNA浓度进行检测,而在公司我们会结合Qubit、Nanodrop、琼脂糖电泳三种方法检测DNA样品的质量; 2、由于不同检测方法的原理不同,所以检测出的结果也会存在一定的差异 阅读全文
posted @ 2017-08-03 00:13 弗雷赛斯 阅读(5440) 评论(0) 推荐(0)
摘要:网络图 Network 网络图虽然给人高大上的感觉,但是由于信息太多,无法给读者提供读有效的可读信息或是读者不知道该理解什么,总是让人望尔却步。那是因为大家太不了解网络,自己读不懂网络想表达的意思及其重要性。 因此我要举一个网络分析重要的例子,大家都知道2012年诺贝尔奖得主Yamanaka提出的诱 阅读全文
posted @ 2017-08-03 00:12 弗雷赛斯 阅读(4492) 评论(0) 推荐(0)
摘要:三元图/三元相图 Ternary Plot 三元图有6种英文叫法,其中ternary plot最为常用。三元图是重心图的一种,它有三个变量,但需要三者总和为恒定值。在一个等边三角形坐标系中,图中某一点的位置代表三个变量间的比例关系。常用于物理化学、 岩石学、矿物学、冶金学和其它物理科学,用于表示在同 阅读全文
posted @ 2017-08-03 00:11 弗雷赛斯 阅读(6002) 评论(0) 推荐(0)
摘要:火山图 Volcano plot 在统计学上,火山图是一种类型的散点图,被用于在大数据中快速鉴定变化。由于它的形成像火山喷发的样子,所以被称为火山图。和上文讲的曼哈顿图类似。 火山图基本元素 火山图也有很多种样式,在生物学高通量测序结果中,常见有的X和Y轴分别为aboundance 和 fold-c 阅读全文
posted @ 2017-08-03 00:10 弗雷赛斯 阅读(4313) 评论(0) 推荐(0)
摘要:韦恩图 Venn Diagram Venn Diagram,也称韦恩图、维恩图、文氏图,用于显示元素集合重叠区域的图示。 韦图绘制工具 常用R语言的VennDiagram包绘制,输出PDF格式方便修改。此外还有非常多的在线工具,使用方便。详见“轻松绘制各种Venn图” 韦恩图在扩增子中用途 展示各样 阅读全文
posted @ 2017-08-03 00:10 弗雷赛斯 阅读(5156) 评论(0) 推荐(0)
摘要:曼哈顿图 Manhattan Plot 曼哈顿图本质上是一个散点图,用于显示大量非零大范围波动数值,最早应用于全基因组关联分析(GWAS)研究展示高度相关位点。它得名源于样式与曼哈顿天际线相似(如下图)。 近几年,在宏基因组领域,尤其是差异OTU结合分类学结果,采用Manhattan plot展示有 阅读全文
posted @ 2017-08-03 00:09 弗雷赛斯 阅读(10931) 评论(0) 推荐(0)
摘要:热图是使用颜色来展示数值矩阵的图形。通常还会结合行、列的聚类分析,以表达实验数据多方面的结果。 热图在生物学领域应用广泛,尤其在高通量测序的结果展示中很流行,如样品-基因表达,样品-OTU相对丰度矩阵非常适合采用热图呈现。 热图优点 因为人读数字需要思考和比较,而对颜色识别能力非常强,采用颜色的深浅 阅读全文
posted @ 2017-08-02 23:25 弗雷赛斯 阅读(7458) 评论(0) 推荐(0)
摘要:散点图 数据点在直角坐标系平面上的分布图。在宏基因组领域,散点图常用于展示样品组间的Beta多样性,常用的分析方法有主成分分析(PCA),主坐标轴分析(PCoA/MDS)和限制条件的主坐标轴分析(CPCoA/CCA/RDA)。 Beta多样性 Beat多样性是生态学概念,专指不同组或生态位间物种组成 阅读全文
posted @ 2017-08-02 23:24 弗雷赛斯 阅读(4983) 评论(0) 推荐(0)
摘要:箱线图 箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。因形状如箱子而得名。在宏基因组领域,常用于展示样品组中各样品Alpha多样性的分布 箱线图 箱形图(Box-plot)又称为盒须图、盒式图或箱线图,是一种用作显示一组数据分散情况资料的统计图。 阅读全文
posted @ 2017-08-01 21:48 弗雷赛斯 阅读(6564) 评论(0) 推荐(0)
摘要:一些常用基本概念的介绍: flowcell流动池 是指Illumina测序时,测序反应发生的位置,1个flowcell含有8条lane lane通道 每一个flowcell上都有8条泳道,用于测序反应,可以添加试剂,洗脱等等 tile 每一次测序荧光扫描的最小单位 reads 指测序的结果,1条序列 阅读全文
posted @ 2017-08-01 21:47 弗雷赛斯 阅读(2390) 评论(0) 推荐(0)
摘要:2017年4月28日,核酸研究(Nucleic Acids Research)杂志上,在线公布了一个可搜索微生物次生代谢物合成基因组簇的综合性数据库antiSMASH数据库 4.0版,前3版年均引用250次,累计引物1600+;可实现基因组与基因组之间的相关天然产物合成基因簇的查询和预测。 临床上使 阅读全文
posted @ 2017-08-01 21:46 弗雷赛斯 阅读(3770) 评论(0) 推荐(0)
摘要:本示例的的数据来自文章《Moving pictures of the human microbiome》,Genome Biology 2011,取样来自两个人身体四个部位五个时间点 进入环境 source activate qiime2-2017.8 退出环境 source deactivate 阅读全文
posted @ 2017-08-01 21:43 弗雷赛斯 阅读(3519) 评论(0) 推荐(0)