使用seqkit软件用fasta文件中提取指定的scaffold

 

001、提取单条contig

复制代码
[root@pc1 test4]# ls
test.fa
[root@pc1 test4]# cat test.fa     ## 测试fasta文件
>contig_1
ATAGAGACGACC
>contig_2
ATAGGACNNAGACACGTTAGAT
>contig_3
TTGCACATATACATCATNNN
>contig_4
GTATGAGCATAGACATACATC
[root@pc1 test4]# seqkit grep -p contig_2 test.fa
>contig_2
ATAGGACNNAGACACGTTAGAT
复制代码

 

 

002、 批量提取contig

复制代码
[root@pc1 test4]# ls
list  test.fa
[root@pc1 test4]# cat list     ## 将contig放入列表文件
contig_1
contig_3
[root@pc1 test4]# cat test.fa     ## 测试fasta文件
>contig_1
ATAGAGACGACC
>contig_2
ATAGGACNNAGACACGTTAGAT
>contig_3
TTGCACATATACATCATNNN
>contig_4
GTATGAGCATAGACATACATC
[root@pc1 test4]# seqkit grep -f list test.fa    ## 提取contig
[INFO] 2 patterns loaded from file
>contig_1
ATAGAGACGACC
>contig_3
TTGCACATATACATCATNNN
复制代码

 

posted @   小鲨鱼2018  阅读(355)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2020-12-02 Linux中利用DHCP服务为特定设备分配固定IP
2020-12-02 linux系统中部署DHCP服务并验证
点击右上角即可分享
微信分享提示