linux 中 shell 实现从fasta中提取任意的scaffold数据

 

001、测试数据

复制代码
[root@pc1 test2]# ls
a.fa
[root@pc1 test2]# cat a.fa    ## 测试数据
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg
复制代码

 

 

 

002、sed命令实现提取任意的scaffold数据:

提取scaffold1

复制代码
[root@pc1 test2]# cat a.fa
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg
[root@pc1 test2]# sed -n '/^>chr1/,/^>/p' a.fa | sed '1b; />/d'   ## 提取scaffold1
>chr1
ddtttggggg
eeeeee
复制代码

 

 

003、提取scaffold3

复制代码
[root@pc1 test2]# ls
a.fa
[root@pc1 test2]# cat a.fa       ## 测试数据
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg
[root@pc1 test2]# sed -n '/^>chr3/,/^>/p' a.fa | sed '1b; />/d'   ## 提取scaffold3
>chr3
uuuuueeeee
qqqqqqqqq
复制代码

 

 

004、提取scaffold5

复制代码
[root@pc1 test2]# ls
a.fa
[root@pc1 test2]# cat a.fa            ## 测试数据
>chr1
ddtttggggg
eeeeee
>chr2
iiiiirrrr
sssssssss
>chr3
uuuuueeeee
qqqqqqqqq
>chr4
tttttttt
wwwwwww
>chr5
yyyyyyy
ggggggg
[root@pc1 test2]# sed -n '/^>chr5/,/^>/p' a.fa | sed '1b; /^>/d'    ## 提取scaffold5
>chr5
yyyyyyy
ggggggg
复制代码

 

posted @   小鲨鱼2018  阅读(68)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2020-12-23 python中字符串的常规处理
2020-12-23 VMware安装win7虚拟机
点击右上角即可分享
微信分享提示