bwa软件对参考基因组构建索引文件

 

1、当参考基因组

大于2G时(约20亿个核苷酸,20,0000,0000):bwa index -a bwtsw  xxx.fa

小于2G时(约20亿个核苷酸,20,0000,0000):bwa index xxx.fa

 

2、统计参考基因组碱基数目

root@DESKTOP-1N42TVH:/home/test# ls
Arabidopsis_thaliana.TAIR10.dna.toplevel.fa
root@DESKTOP-1N42TVH:/home/test# grep -v "^>" Arabidopsis_thaliana.TAIR10.dna.toplevel.fa | awk 'BEGIN{sum = 0} {sum += length($0)} END {print sum}'
119667750

 

3、bwa对参考基因组构建索引,生成五个文件

root@DESKTOP-1N42TVH:/home/test# ls
Arabidopsis_thaliana.TAIR10.dna.toplevel.fa
root@DESKTOP-1N42TVH:/home/test# bwa index Arabidopsis_thaliana.TAIR10.dna.toplevel.fa
root@DESKTOP-1N42TVH:/home/test# ls
Arabidopsis_thaliana.TAIR10.dna.toplevel.fa      Arabidopsis_thaliana.TAIR10.dna.toplevel.fa.bwt
Arabidopsis_thaliana.TAIR10.dna.toplevel.fa.amb  Arabidopsis_thaliana.TAIR10.dna.toplevel.fa.pac
Arabidopsis_thaliana.TAIR10.dna.toplevel.fa.ann  Arabidopsis_thaliana.TAIR10.dna.toplevel.fa.sa

 

posted @   小鲨鱼2018  阅读(3172)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2021-04-28 python中列表的反转与排序
2021-04-28 python中返回列表中特定指定元素的所有索引
2021-04-28 python中返回列表元素的每一个元素的频数
2021-04-28 python中列表元素的去重复
2021-04-28 python中列表的连接操作符、重复操作符、成员关系操作符
2021-04-28 python中列表切片
2021-04-28 python中从列表中删除元素
点击右上角即可分享
微信分享提示