哈代平衡 &连锁不平衡
哈代-温伯格平衡定律(Hardy-Weinberg equilibrium),即HW平衡,是指对于一个大且随机交配的种群,基因频率和基因型频率在没有迁移、突变和选择的条件下会保持不变。
它是建立在一个理想的群体模式上的,有四个假设前提:1.群体无限大;2.随机婚配;3.没有突变;4.没有大规模迁移和选择因素的影响。其结论是群体中的基因频率和基因型频率在逐代传递中保持不变。
实际上这种理想群体的条件不可能完全满足,但经过数学推导,在一个群体中,基因频率和基因型频率在每一代都是恒定的,即使未达到平衡的群体,只需繁殖一代即可重新达到平衡。
其一个重要意义在于对抽样调查的结果进行检验,评估所研究的对象群体是否符合HW平衡,从而评估群体调查资料的可靠性,特别是在遗传流行病学关联研究中。
通常采用吻合度检验运用卡方统计量衡量基因型数目的观察值与该位点上全部基因型频率分布在符合HW平衡时的期望值之间的吻合程度。一般以P=0.05作为显著性水平的界值,
P>0.05说明所调查的群体达到遗传平衡,即本次群体调查的数据可信;反之,P<0.05时,需要考虑以下问题:1.
被调查的群体是否处于遗传平衡状态;2.遗传标记(如SNP)分型的技术或标准是否出现误差;3.是否达到随机抽样的要求。特别是后两点需要注意!
哈代-温伯格定律,也称“遗传平衡定律”或“哈代-温伯格平衡定律”,分别在1908年和1909年由英国数学家G·H·哈代(GodfreyHaroldHardy)和德国医生温伯格(WilhelmWeinberg)独立证明。在群体遗传学中,哈代-温伯格定律主要用于描述群体中等位基因频率以及基因型频率之间的关系。
对于两个等位基因的哈代-温伯格定律:横轴表示两个等位基因频率p和q,而纵轴表示基因型频率。每条线表示一种基因型频率。
主要内容为:
一个群体在理想情况(不受特定的干扰因素影响,如非随机交配、选择、迁移、突变或群体大小有限),经过多个世代,基因频率与基因型频率会保持恒定并处于稳定的平衡状态。
实际上,总会存在一个或多个干扰因素。因此,哈代-温伯格定律在自然界中是不可能的。基因的平衡是一种理想状态,并用于测量遗传改变的基准。
最简单的例子是位于单一位点的两个等位基因:显性等位基因记为A而隐性等位基因记为a,它们的频率分别记为p和q。频率(A)=p;频率(a)=q;p+q=1。如果群体处于平衡状态,则我们可以得到
群体中纯合子AA的频率(AA)=p2
群体中纯合子aa的频率(aa)=q2
群体中杂合子Aa的频率(Aa)=2pq
这些频率称为哈代-温伯格平衡。无限大小的群体经过一个世代的随机交配,基因型频率就能达到平衡。在没有其它因素的影响下,这种平衡状态将一直保持。
一个群体在理想情况(不受特定的干扰因素影响,如非随机交配、选择、迁移、突变或群体大小有限),经过多个世代,基因频率与基因型频率会保持恒定并处于稳定的平衡状态。
实际上,总会存在一个或多个干扰因素。因此,哈代-温伯格定律在自然界中是不可能的。基因的平衡是一种理想状态,并用于测量遗传改变的基准。
最简单的例子是位于单一位点的两个等位基因:显性等位基因记为A而隐性等位基因记为a,它们的频率分别记为p和q。频率(A)=p;频率(a)=q;p+q=1。如果群体处于平衡状态,则我们可以得到
群体中纯合子AA的频率(AA)=p2
群体中纯合子aa的频率(aa)=q2
群体中杂合子Aa的频率(Aa)=2pq
这些频率称为哈代-温伯格平衡。无限大小的群体经过一个世代的随机交配,基因型频率就能达到平衡。在没有其它因素的影响下,这种平衡状态将一直保持。
人类基因组中连锁不平衡(linkage disequiibrium, LD)
人类基因组中连锁不平衡(linkage disequiibrium, LD)的程度和分布情况在基因定位中极其重要,无论是作为复杂疾病精细定位时的工具,还是作为未来全基因组关联分析的基础。另外,连锁不平衡的知识还有助于有关人类的历史和起源,染色体重组等的研究。本节将从连锁不平衡的理论基础,如何应用在复杂疾病的研究中,这一方法存在的局限性,以及一些统计遗传软件的介绍来试图给出这一遗传疾病研究的重要工具的大概。 连锁不平衡分析的群体遗传学基础 连锁不平衡的含义 连锁不平衡又称等位基因关联(allelic association),其原理其实很简单。假定两个紧密连锁的位点1,2,各有两个等位基因(A,a; B,b),那么在同一条染色体上将有四种可能的组合方式:A-B,A-b,a-B,和a-b。假定等位基因A的频率为Pa,B的频率为Pb,那么如果不存在连锁不平衡(如组成单倍型的等位基因间相互独立,随机组合)单倍型A-B的频率就应为PaPb。而如果A与B是相关联的,单倍型A-B的频率则应为PaPb+δ,δ是表示两位点间LD程度的值。如果位点2上的等位基因B与疾病易患性有关,那么将会观察到等位基因A的频率在病人群体中高于对照群体。换句话说,等位基因A与该疾病性状相关。事实上,可以检测遍布基因组中的大量遗传标记位点,或者候选基因附近的遗传标记来寻找到因为与致病位点距离足够近而表现出与疾病相关的位点,这就是等位基因关联分析或连锁不平衡定位基因的基本思想。 产生和破坏连锁不平衡的因素 基因组中紧密连锁的基因位点在随机交配的群体中经过许多世代的重复交换而被随机化,出现了连锁平衡。概括地说,连锁不平衡可能有如下三个原因:1,被考察的群体来源于等位基因频率不同的群体,而且两个群体混合的时间不足以产生完全的随机化。2,两个基因位点之间的距离非常接近,以至于尚未经历足够的世代来被重组分开。3,某些连锁基因位点的等位基因的组合(单倍型)通过自然选择保持较高的频率。当由于以上原因群体开始偏离连锁平衡时,达到新的平衡所需的时间取决于基因位点间连锁的紧密程度:连锁越紧密,达到平衡的时间就越长。 |