04 2016 档案

samtools flags 的含义
摘要:对于双端比对的数据,生成的BAM文件中,R1端序列和R2端序列的标识符是一样的,之前一直不知道如何根据bam文件区分哪条序列是R1端,哪条序列是R2端,昨天仔细研究了一下,原来代表R1端和R2端的信息都存储在flag中,即bam文件的第二列; 在bam文件格式中定义了各种flag代表的意思 1 : 阅读全文

posted @ 2016-04-27 10:19 庐州月光 阅读(16150) 评论(0) 推荐(0) 编辑

vsearch 去除重复序列和singleton 序列
摘要:在16S数据分析中,为了减少聚类的时间,提高准确度,需要去除重复序列,而singleton序列因为没有其他的序列作为验证,可信度不是很高,也需要去除,通常情况下使用usearch 完成这2项任务,但是usearch 64位是收费的,而32为的usearch 在64位的red hat 上测试时,去除重 阅读全文

posted @ 2016-04-20 14:44 庐州月光 阅读(3766) 评论(0) 推荐(0) 编辑

Fastqc 能够识别的碱基编码格式
摘要:Fastqc 能够自动识别序列的碱基编码格式,我查看一下源代码,发现是碱基编码格式一共分为 1)sanger/illumina 1.9 2) illumina 1.3 3) illumina 1.5 其核心的代码为 通过找到对应的ASCII值最小的碱基质量值来判断对应的编码格式, 在ASCII码表中 阅读全文

posted @ 2016-04-06 14:31 庐州月光 阅读(1892) 评论(0) 推荐(0) 编辑

Fastqc 碱基质量分布图
摘要:横坐标代表每个每个碱基的位置,反映了读长信息,比如测序的读长为150bp,横坐标就是1到150; 纵坐标代表碱基质量值, 图中的箱线图代表在每个位置上所有碱基的质量值分布, 中间的红线代表的是中位数 用黄色填充的区域的上下两端分别代表上四分位数和下四分位数; 箱线图最上方的短线代表90%,最下方的短 阅读全文

posted @ 2016-04-06 09:46 庐州月光 阅读(5023) 评论(0) 推荐(0) 编辑

< 2025年3月 >
23 24 25 26 27 28 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 29
30 31 1 2 3 4 5

统计

点击右上角即可分享
微信分享提示