处理bam文件提取信息
一般来说,一个bam文件通常只包含一个样本的信息,最多需要进行染色体位置的处理, samtools也提供了简单的处理方式,比如要提取 chr1的reads, 只需要:
samtools view input.bam ch1
这几天遇到了10x genomics的bam结果,发现单细胞的reads全包含在一个bam文件里,用barcode进行区分,因此可能就需要提取其中的信息,比如提起某一个细胞的reads,那么可以:
samtools view possorted_genome_bam.bam -h | sed -n "/^@\|TCTGAGAAGAAACCAT-1/p" | samtools view -b > result.bam
其实就是多了 sed 的处理过程 ,之所以加以记录,是因为在处理过程中
samtools -h
保留的header在将sam结果转化会bam格式是必须的,以防下次忘记.