WGS数据分析中测序深度、比对深度、比对覆盖度的计算

 

001、测序深度 = 测序量 / 基因组的大小。

a、根据fastq计算测序的碱基数目

b、计算参考基因组的碱基数目

c、a的结果/b的结果 

 

002、比对深度 = 比对上所有位点深度之和/比对上的位点的数目。

测试:

复制代码
(base) [b20223040323@admin1 test4]$ ls
SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth
(base) [b20223040323@admin1 test4]$ ls
SRR1770413.depth  SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ head -n 3 SRR1770413.depth
NC_000913.3     1       26
NC_000913.3     2       27
NC_000913.3     3       29
(base) [b20223040323@admin1 test4]$ awk '{sum += $3} END {print sum / NR}' SRR1770413.depth      ## 计算比对深度
57.2948
复制代码

 

003、覆盖度 = 至少比对上1次的位点数目/基因组的大小。

(base) [b20223040323@admin1 test4]$ ls
SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth    ## 基础统计
(base) [b20223040323@admin1 test4]$ ls
SRR1770413.depth  SRR1770413.sorted.markdup.bam  SRR1770413.sorted.markdup.bam.bai
(base) [b20223040323@admin1 test4]$ awk 'END {print NR/genome_size}' SRR1770413.depth        ## 计算覆盖度, genoem_size是参考基因组的碱基数目

 。

 

posted @   小鲨鱼2018  阅读(31)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
历史上的今天:
2023-01-27 西数硬盘颜色
2021-01-27 bash: javac: command not found...
点击右上角即可分享
微信分享提示