WGS数据分析中测序深度、比对深度、比对覆盖度的计算
001、测序深度 = 测序量 / 基因组的大小。
a、根据fastq计算测序的碱基数目
b、计算参考基因组的碱基数目
c、a的结果/b的结果
002、比对深度 = 比对上所有位点深度之和/比对上的位点的数目。
测试:
(base) [b20223040323@admin1 test4]$ ls SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth (base) [b20223040323@admin1 test4]$ ls SRR1770413.depth SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ head -n 3 SRR1770413.depth NC_000913.3 1 26 NC_000913.3 2 27 NC_000913.3 3 29 (base) [b20223040323@admin1 test4]$ awk '{sum += $3} END {print sum / NR}' SRR1770413.depth ## 计算比对深度 57.2948
003、覆盖度 = 至少比对上1次的位点数目/基因组的大小。
(base) [b20223040323@admin1 test4]$ ls SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ samtools depth SRR1770413.sorted.markdup.bam > SRR1770413.depth ## 基础统计 (base) [b20223040323@admin1 test4]$ ls SRR1770413.depth SRR1770413.sorted.markdup.bam SRR1770413.sorted.markdup.bam.bai (base) [b20223040323@admin1 test4]$ awk 'END {print NR/genome_size}' SRR1770413.depth ## 计算覆盖度, genoem_size是参考基因组的碱基数目
。
分类:
生信
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 震惊!C++程序真的从main开始吗?99%的程序员都答错了
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 单元测试从入门到精通
· 上周热点回顾(3.3-3.9)
· winform 绘制太阳,地球,月球 运作规律
2023-01-27 西数硬盘颜色
2021-01-27 bash: javac: command not found...