文献阅读 | The human Y chromosome: an evolutionary marker comes of age

Jobling M A, Tyler-Smith C. The human Y chromosome: an evolutionary marker comes of age[J]. Nature Reviews Genetics, 2003, 4(8): 598-612.

人类Y染色体具有很多特别的地方,尤其是其变异来源十分简单,几乎不发生重组。正因Y染色体的特殊性,其成为了从男性角度研究近代人类进化的极好工具,并在医学和法医遗传学上起着特殊但重要的作用。对于Y染色体系统发育树的研究已经进行了很长一段时间,Y-tree也在不断被更新。最新的Y-tree可以在这里看到。本次阅读的文献是2003年发表的一篇综述文章,介绍了Y染色体DNA变异在人类进化研究中的应用。在该文章中,作者的“单倍型”是对整条Y染色体而言的。

作者指出,由Y染色体给出的地理信息十分强大(powerful),因为其提供了不受重组干扰的、详细且容易解读的单倍型。其在mtDNA中有明显对应物,但在以前,常染色体由于包含许多多态性的、足够长的区段由于重组的原因,似乎并不能提供什么信息。然而,现在有证据表明基因组存在单倍型块结构——常染色体上的强连锁不平衡区域。从种群中的LD模式上已经检测到了许多区块,一些区块间的边界对应了重组热点区域。至于每个区块能否像Y染色体一样进行研究、利用SNP和微卫星组合来定义单倍型,还需要更多研究。如何从基因型中确定或推断单倍型、如何定义“块”也需要进一步探索。单倍型中错误的影响和解释罕见充足事件的最佳方式也需要探索。

此外,在文章侧栏的名词解释中,对“haplogroup”的定义为A haplotype that is defined by binary markers, which is more stable but less detailed than one defined by microsatellites。其中,微卫星是指一类由串联的重复序列组成的重复DNA序列,长度为2-8个核苷酸。 它们可能是高度多态的,经常在群体遗传学研究中用作分子标记

考虑到Y染色体上重组的缺乏,基因作图(gene mapping)的方法无法提供有用信息,同时,物理分析则至关重要。因此,相对于其他染色体,能否获取到近乎完整的常染色质序列在Y染色体的研究更为重要。对Y染色体近乎完整的常染色质序列的研究,引发了许多对过去研究结果的质疑,并产生了许多新的认知,为新一代研究人类种群,突变
过程和基因组的Y染色体多样性提供了起点。

Y染色体是男性特有的染色体。与其他染色体不同,Y染色体很大程度上避开了减数分裂中的重组过程。其上确有2个片段会与X染色体重组,但长度均不到3Mb(Y染色体总长约60Mb)。本综述中提到的“Y染色体”指代大部分的非重组部分(分为NRY, NRPY and MSY)。

Y染色体避开了重组的重要性体现在其单倍型(染色体上marker的等位基因状态的组合)可以一代代完整地传递,且仅由突变而改变。这样简单的变异方式使得构建系统发育更为容易。在性别比1:1的假设下,在总种群中,Y染色体的有效种群大小是常染色体的四分之一,是X染色体的三分之一,并与有效的单倍体mtDNA(effectively
haploid mitochondrial DNA)相似。

假设相同的突变过程发生在所有染色体上,则Y染色体上的序列多样性期望回避比核基因组中的其他染色体更低(实际观察到的情况也确实如此)。同时,Y染色体更易受到遗传漂变的影响,而漂变加速了不同群体中Y染色体组之间的分化。正因漂变的作用,单倍型频率能够随时间快速变化。因此,对这些事件的量化(如人口之间的混合比例或过去的人口变化)的结果可能会不够可靠。

地理上的聚类会进一步受到携带者Y染色体的男性的行为所影响。相对于女性,男性通常会住在离出生地更近的地方,进而增强Y染色体的地区差异。相比之下,仅由女性传递的mtDNA有望显示出减少的地理集群性。

下图展示了Y染色体单倍型的全球分布

与人类DNA的所有区域一样(mtDNA控制区除外),点突变(base substitutional mutation)发生的频率太低,无法直接分析。然而,一个安全的系统发育框架和Y染色体的单倍性意味着可以明确地识别出反复出现的突变(recurrent mutation),且从重测序中积累的数据将提供有关单个碱基突变特性的信息。人类群体十分庞大,以至于即使给出了低至大约\(2 \times 10^{-8}\)每碱基每代的突变频率,我们仍能认为反复出现的突变会在每一代的Y染色体的每个碱基上均有发生。然而,这些现代的重复突变通常没有被发现。目前,Y Chromosome Consortium (YCC) tree中重复出现的点突变只有5个。

下图为基于YCC2003的系统发育树,并进行了改动。分支和分支名称及其名字与上图的饼图相对应。副组(即不是由 derived marker定义的家系),采用星号标记。

遗传疾病研究显示,父亲是新突变来源的倾向很强,且突变率随年龄增加而增长。对这两种现象的解释分别是男性配子中发生细胞分裂的数量比女性多,因而复制发生多;以及生精干细胞(spermatogenic stem cells)的突变频率随持续分裂的时间增加而增大。由于Y染色体只在男性中传递,它的变异特性对Y染色体的影响比其他任何因素都大。可以通过比较在给定时间段内同源常染色体Y染色体和X染色体序列中积累的突变数来估算男女突变率的比率(α-factor)。

随后,作者结合各地域的习俗等特征,分析了单倍群的地域分布。

在旧石器时代,主要由移民和漂流(migration and drift)而建立的Y染色体多样性模式就已经被“冻结”了,大规模变化变得不那么频繁了。当然,最近发生的时间偶尔也会对Y染色体多样性产生重大影响。通过对y染色体数据和mtDNA数据的比较,可以特别揭示出在过去500年里随着欧洲人向美洲和大洋洲扩张而产生的性别特异性基因流动。

作者在结论中,总结了当时数据库中存储的Y染色体SNP记录并不完全准确、难以区分Y染色体多样性与X-Y、Y-Y重复序列变异等问题,但仍不失为一个有潜在价值的资源库,并可用于微卫星的识别等。随着重测序的发展与成本的降低,该方法将逐渐用于Y染色体研究。对于古代DNA,mtDNA由于其高拷贝数而更有可能保存下来。但利用PCR进行体外受损核DNA的修复也十分有前景,并可能在未来实现Y染色体的可靠扩增。Y染色体提供的系统地理信息在mtDNA中也有对应,二者的对比往往能够提供丰富的信息,但对大量的独立基因座进行检查是被建议的。(作者海还展望了黑猩猩基因组中Y染色体的研究)

posted @ 2020-08-31 01:22  esctrionsit  阅读(446)  评论(0编辑  收藏  举报