摘要:
step1:grep data step2:build index Picard CreateSequenceDictionary creates .dict file and samtools faidx creates a .fai file. Both are needed for GATK 阅读全文
摘要:
reference:https://davetang.org/wiki/tiki-index.php?page=SAM @SQ SN:contig1 LN:9401 (序列ID及长度) 参考序列名,这些参考序列决定了比对结果sort的顺序,SN是参考序列名;LN是参考序列长度;每个参考序列为一行。 阅读全文
摘要:
第一列 NAME : 序列的名称,只保留“>”后,第一个空白之前的内容; 第二列 LENGTH: 序列的长度, 单位为bp; 第三列 OFFSET : 第一个碱基的偏移量, 从0开始计数,换行符也统计进行;gff文件中的mRNA start那一列的值 第四列 LINEBASES : 除了最后一行外, 阅读全文
摘要:
其中: 参数-a用于指定建立索引的算法: bwtsw 适用于>10M is 适用于参考序列<2G (默认-a is) 可以不指定-a参数,bwa index会根据基因组大小来自动选择合适的索引方法 .amb is text file, to record appearance of N (or ot 阅读全文