phasing 是什么? phasing的原理是什么?
phasing 是什么?
phasing就是将二倍体生物的等位基因归类到不同的染色体上。
比如一个个体一个位点的基因型是A-G;另一个位点的基因型是T-C;
那么第一个位点和第二个位点中哪两个等位基因是来自一条染色体? 哪两个是来自另一条染色体?、
一种情况如下:
第一个位点的A和第二个位点的T来自一条染色体;那么第一个位点的G和第二个位点的C就来自另一条染色体。 即AT | GC
另一种情况是:
第一个位点的A 和 第二个位点的C来自一条染色体,那么第一个位点的G则和第二个位点的T则来自另一条染色体。即 AC | GT
pahsing就是确定到底哪些等位基因是来自一条染色体。
如下图所示:
所谓Phasing就是要把一个二倍体(甚至是多倍体)基因组上的等位基因(或者杂合位点),按照其亲本正确地定位到父亲或者母亲的染色体上,最终使得所有来自同一个亲本的等位基因都能够排列在同一条染色体里面。
reference:
01、https://www.jianshu.com/p/a30de54b83c3
phasing的原理是什么?
目前通常采用马尔科夫链蒙特卡洛算法来完成,因此,Phasing算法本身基本都是计算密集型的,做起来也比较耗时间,有时即使是在超算集群中也得跑很长时间。
reference:
01、https://www.jianshu.com/p/a30de54b83c3