linux 中shell脚本统计参考基因组中碱基的总数目

 

1、方法1

root@DESKTOP-1N42TVH:/home/test# ls
hg38.fa
root@DESKTOP-1N42TVH:/home/test# grep -v "^>" hg38.fa | awk 'BEGIN{sum = 0} {sum += length($0)} END {print sum}'
3209286105

 

2、方法2

root@DESKTOP-1N42TVH:/home/test# ls
hg38.fa
root@DESKTOP-1N42TVH:/home/test# grep -v "^>" hg38.fa | sed 's/./&\n/g' | awk 'NF' | wc -l     ## 非常耗时
3209286105

 

约32亿个碱基, 这说明参考基因组是单链?

posted @   小鲨鱼2018  阅读(309)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2021-04-26 linux系统中如何将一行数据转换为一列数据
2021-04-26 linux系统中如何把一列数据转换为一行数据
点击右上角即可分享
微信分享提示