linux 中awk命令实现从gff文件中排除pseudogene信息

 

001、

复制代码
[b20223040323@admin2 test]$ ls
a.gff
[b20223040323@admin2 test]$ cat a.gff
region      1
pseudogene  2
transcript  3
exon        4
pseudogene  5
transcript  6
exon        7
gene        8
miRNA       9
exon        10
pseudogene  11
pseudogene  12
mRNA        13
exon        14
pseudogene  15
gene        16
mRNA        17
gene        18
exon        19
gene        20
lnc_RNA     21
[b20223040323@admin2 test]$ awk 'BEGIN{tag = "yes"}{if($1 == "pseudogene") {tag = "no"}; if($1 == "gene") {tag = "yes"}; if(tag == "yes") {print $0}}'  a.gff  ## 过滤掉pseudo信息
region      1
gene        8
miRNA       9
exon        10
gene        16
mRNA        17
gene        18
exon        19
gene        20
lnc_RNA     21
复制代码

 

posted @   小鲨鱼2018  阅读(44)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2022-06-08 R语言中空值NA、""、NULL的区别
2022-06-08 R语言 中 %||%函数
2022-06-08 R语言中any、all函数的用法
2022-06-08 R语言中switch函数的用法
2021-06-08 c语言 13 - 6
2021-06-08 c语言中显示文件内容
2021-06-08 c语言 13 - 5
点击右上角即可分享
微信分享提示