摘要: 0. 基本参数 基因组大小:G Read读长:L 总Read条数:n_r 1. 碱基深度分布 单条Read测序覆盖到某一个碱基的概率:L/G 因为L/G很小,n_r很大,每个碱基覆盖深度服从泊松分布。 则每个碱基的覆盖深度的期望为:d_n=(L/G)*n_r 2. K-mer深度分布 假设基因组对K 阅读全文
posted @ 2018-11-03 01:52 Azrael_cc 阅读(5759) 评论(0) 推荐(1) 编辑
摘要: 1. 统计fasta文件序列条数(Shell) 2. fastq转换成fasta格式(Shell) 3. 统计read数目和read长度(Shell) 4. coverage乘数概率问题(R) 5. SOAPdenovo组装 config文件 # config文件 #maximal read len 阅读全文
posted @ 2018-11-03 00:47 Azrael_cc 阅读(371) 评论(0) 推荐(0) 编辑
摘要: http://www.cnblogs.com/leezx/p/5601525.html http://cncbi.github.io/BWA-Manual-CN/ http://www.htslib.org/download/ http://www.htslib.org/doc/samtools.h 阅读全文
posted @ 2018-11-02 22:05 Azrael_cc 阅读(2164) 评论(0) 推荐(1) 编辑