使用seqkit软件用fasta文件中提取指定的scaffold

 

001、提取单条contig

[root@pc1 test4]# ls
test.fa
[root@pc1 test4]# cat test.fa     ## 测试fasta文件
>contig_1
ATAGAGACGACC
>contig_2
ATAGGACNNAGACACGTTAGAT
>contig_3
TTGCACATATACATCATNNN
>contig_4
GTATGAGCATAGACATACATC
[root@pc1 test4]# seqkit grep -p contig_2 test.fa
>contig_2
ATAGGACNNAGACACGTTAGAT

 

 

002、 批量提取contig

[root@pc1 test4]# ls
list  test.fa
[root@pc1 test4]# cat list     ## 将contig放入列表文件
contig_1
contig_3
[root@pc1 test4]# cat test.fa     ## 测试fasta文件
>contig_1
ATAGAGACGACC
>contig_2
ATAGGACNNAGACACGTTAGAT
>contig_3
TTGCACATATACATCATNNN
>contig_4
GTATGAGCATAGACATACATC
[root@pc1 test4]# seqkit grep -f list test.fa    ## 提取contig
[INFO] 2 patterns loaded from file
>contig_1
ATAGAGACGACC
>contig_3
TTGCACATATACATCATNNN

 

posted @ 2022-12-02 12:30  小鲨鱼2018  阅读(281)  评论(0编辑  收藏  举报