更改Bam文件染色体名字
更改Bam文件染色体名字
本文作者:Sunny-King
发布时间:2022-08-19 10:53:42 星期五
本文链接:https://www.cnblogs.com/Sunny-King/p/Bioinformatics-Bam_reheader.html
最近遇到一个bam文件格式的问题,拿到的bam种染色体是1、2、3...不带chr的,而已知信息是chr1、chr2、等格式,为了同一个是,我们利用samtools将ban文件格式统一更改为chr1等格式。下面介绍一下具体实现过程。
一、添加chr
1、从原始ban种提取header
samtools view -H input.bam > header.sam
2、将header中的序列信息全部添加chr
sed '/^@SQ/{s/SN:\([0-9XY]\)/SN:chr\1/g;s/SN:MT/SN:chrM/g}' header.sam > new.header.sam
bam文件的header中@SQ开头的行用以存储序列信息,在更改时需匹配到@SQ,然后将核染色体添加chr,而线粒体由MT更改为chrM。
3、利用reheader重置bam文件的header,需注意,输入的header需用sam文件
samtools reheader new.header.sam input.bam > output.bam
二、去掉chr
去掉chr时步骤类似,秩序将第二步替换为下面命令即可
sed '/^@SQ/{s/SN:chr\([0-9XY]\)/SN:\1/g;s/SN:chrM/SN:MT/g}' header.sam
本文作者:Sunny-King
本文链接:文章来源于博客园 https://www.cnblogs.com/Sunny-King/p/Bioinformatics-Bam_reheader.html
转载要求:欢迎转载,转载之后请务必在文章明显位置标出原文链接和作者
错误修复:如有错误或疑问请联系博主
版权声明:本作品采用署名-非商业使用-禁止演绎 (by-nc-nd)许可协议进行许可
如果本文对您有帮助,请点个赞吧!志同道合的朋友可以点个关注。