Nature | 生物体可以从头产生新基因


图片来源(Levy et al. Nature, 2019)
 

“科学家们长期以来认为,进化修补旧基因时会出现新基因。事实证明,自然选择更具创造性。”--- ADAM LEVY

 

<更多精彩,可关注微信公众号:AIPuFuBio,和大型免费综合生物信息学资源和工具平台AIPuFu:www.aipufu.com>

 

在深冬,冰雪覆盖的北冰洋的水温会降到零度以下。天气冷得足以冷冻许多鱼,但这种条件基本对鳕鱼没什么影响。它们血液和组织中的一种蛋白质与微小的冰晶结合,阻止它们生长。

鳕鱼是从哪里获得这种天赋的,这是进化生物学家海勒·泰兰德·巴尔斯路德想要解决的一个难题。她和她在奥斯陆大学的团队搜索了大西洋鳕鱼(Gadus morhua)及其几个近亲的基因组,思考着他们会追踪抗冻基因的表亲。起初没有什么发现。

但是后来她偶然发现,一些研究表明基因并不总是像生物学家长期假设的那样从现有基因进化而来。取而代之的是,有些是由基因组中不编码任何功能分子的荒凉部分形成的。当她回头看鱼的基因组时,她看到了可能是这种情况的暗示:防冻剂蛋白质对鳕鱼的生存至关重要,似乎是从零开始制造的。

鳕鱼有好伙伴。在过去的五年里,研究人员在他们调查的每一个谱系中发现了大量这些新创造的“新生”基因的迹象。这些包括模式生物,如果蝇和老鼠,重要的农作物和人类;一些基因在大脑和睾丸组织中表达,另一些基因则在各种癌症中表达。

新基因甚至引发了对进化理论某些部分的反思。传统观点认为新基因倾向于由现有基因的不小心复制、或与其他的基因混合或被破坏时产生,但是一些研究人员现在认为从头产生基因可能非常普遍:一些研究表明至少十分之一的基因可以用这种方式制造;其他人则估计更多的基因会重新出现,而不是来自基因复制。它们的存在模糊了基因构成的界限,揭示了一些新基因的起始材料是非编码的DNA序列(见“Birthof a gene”)。

北京中国科学院动物研究所的遗传学家ZhangYong研究了新生基因在人脑中的作用,他说生物体以这种方式获取新基因的能力证明了进化的“可塑性,使看似不可能的事情成为可能”。但是研究人员还没有找到如何确定一个基因是新的,关于它们到底是如何——以及多长时间——产生的问题仍然存在。科学家们还想知道,既然已经存在这么多基因现成的材料,为什么进化会费尽心思头开始制造基因。这些基本问题标志着这个领域刚刚开始。巴尔斯路德说:“你不必回到许多年前,新基因进化就被摒弃了”。

 

基因是怎么工作的

科学家们一直认为进化是从旧基因中创造新基因——通过错误地复制它们,或者通过融合或分裂现有基因。现在,越来越多的例子显示基因是从基因组中贫瘠的非编码部分“从头”创造出来的。

基因通常被认为是编码有用分子的任何一段脱氧核糖核酸。为了制造蛋白质,脱氧核糖核酸被转录成核糖核酸,然后被翻译。称为密码子的三个字母的序列决定了要翻译的核糖核酸部分。


图片来源(Levy et al. Nature, 2019)  

 

新产生的基因

回到20世纪70年代,遗传学家认为进化是一个相当保守的过程。当Susumu Ohno提出大多数基因是通过复制进化的假设时,他写道“从严格意义上说,进化中没有什么是从头开始的。每一个新基因都必须来自一个已经存在的基因。”

当基因复制过程中的错误产生一个基因的多个实例时,就会发生基因复制。经过几代,这些版本会产生突变和分歧,因此它们最终会编码不同的分子,每个分子都有自己的功能。自20世纪70年代以来,研究人员已经发现了许多其他进化如何修补基因的例子——现有基因可以被分解或“随后在物种间转移”。所有这些过程都有一些共同之处:它们的主要成分是来自一台运转良好的分子机器的现有代码。

但是基因组不仅仅包含基因:事实上,例如,只有很少一部分人类基因组实际上编码基因。旁边是大量的脱氧核糖核酸——通常被称为“垃圾脱氧核糖核酸”——似乎没有任何功能。其中一些片段与蛋白质编码基因有共同的特征,但实际上并不是基因本身:例如,它们散布着三个字母的密码子,理论上,这些密码子可以告诉细胞将序列翻译成蛋白质。

直到二十一世纪,科学家们开始看到线索,非编码部分的脱氧核糖核酸可能含有赋予蛋白质新功能的区域。随着基因测序发展,研究人员可以比较近亲的整个基因组,他们开始发现基因在进化过程中会很快消失的证据。这让他们怀疑基因是否能同样快地出现。

2006年和2007年,加州大学戴维斯分校的进化遗传学家大卫·贝特恩发表了许多人认为是第一篇证明果蝇中特定基因重新出现的论文。这些研究将这些基因与男性生殖联系起来:开始发现它们在睾丸和精囊腺中表达,在那里,性选择的强大进化力量似乎推动了基因的诞生。

在此之前不久,西班牙巴塞罗那德尔马医院医学研究所的进化基因学家玛尔·阿尔巴已经表明,从进化的角度来说,基因越年轻,进化的速度就越快。她推测这可能是因为年轻基因编码的分子不太完美,需要更多的调整,这可能是基因重新出现的结果——它们没有与先前的旧基因进化而来的基因功能紧密关联。奥尔布赖特和贝京都回忆说,出版他们关于这一主题的早期作品是一项挑战。“有很多怀疑,”阿尔贝说。“事情的变化真令人吃惊。”

研究也开始揭开新基因的作用。例如,一种基因允许地中海水芹植物(拟南芥)生产淀粉,另一种基因帮助酵母细胞生长。理解它们为宿主所做的,应该有助于解释它们为什么存在——为什么从零开始创造比从现有材料进化更有利。“如果我们不理解这些基因在做什么,我们就不会理解它们为什么会进化,”贝京说。

 

等待基因

重新研究基因变成了部分遗传学,部分思维实验。“为什么我们的领域如此困难?”宾夕法尼亚匹兹堡大学的安妮-鲁桑德拉·卡鲁尼斯问道。“这是因为哲学问题。”核心问题是卡鲁尼斯十年来一直在问的一个问题:什么是基因?

基因通常被定义为编码功能分子的脱氧核糖核酸或核糖核酸序列。然而,酵母基因组成千上万的序列,被称为开放阅读框,理论上可以翻译成蛋白质,但是遗传学家认为它们要么太短,要么看起来与那些密切相关的生物太不一样,没有可能的功能。

当卡鲁尼斯在攻读博士学位时,她开始怀疑并非所有这些部分都处于休眠状态。在2012年发表的一项研究中,她观察了这些开放阅读框是否被转录成核糖核酸并翻译成蛋白质——就像基因一样,其中许多也是——尽管尚不清楚这些蛋白质是否对酵母有用,或者它们是否被翻译到足够高的水平来发挥作用。“那么什么是基因呢?我不知道,”卡鲁尼斯说。然而,她认为自己发现的是“进化的原材料——一个蓄水池”。

这些等待基因中的一些,或者卡鲁尼斯和她的同事称之为原始基因,比其他的更像基因,具有更长的序列和更多的将脱氧核糖核酸转化为蛋白质所必需的指令。原始基因可以为进化提供肥沃的试验田,将非编码物质转化为真正的基因。都柏林三一学院研究分子进化的奥菲·麦克利萨特建议说:“这就像是一次测试版的发布。”。

一些研究人员已经超越了观察,将生物体转化为表达非编码物质。瑞典乌普萨拉大学的迈克尔·克诺普(Michael Knopp)和他的同事们表明,在大肠杆菌中插入和表达随机产生的开放阅读框可以增强细菌对抗生素的耐药性,其中一个序列产生的肽可以将耐药性提高48倍。德国普伦马克斯·普朗克进化生物学研究所的迪沃德·陶兹和他的团队使用了类似的方法,显示出一半的序列减缓了细菌的生长,四分之一的序列似乎加快了细菌的生长——尽管这个结果还有争议。这些研究表明,来自随机序列的肽具有惊人的功能。

但是图森市亚利桑那大学的进化生物学家乔安娜·马塞尔说,随机的脱氧核糖核酸序列也可以编码“反应性强、令人讨厌、有聚集和做坏事倾向”的肽。低水平表达这些序列有助于自然选择剔除潜在的危险部分——那些产生混乱或错误折叠蛋白质的部分——从而使物种中剩余的部分相对良性。

阿尔巴说,从非编码区创造基因可能比其他基因制造方法有一些好处。她说,基因复制是一种“非常保守的机制”,产生与其祖先相同的适应性强的蛋白质;相比之下,新生基因可能产生明显不同的分子。对它们来说,很难融入已经建立的基因和蛋白质网络,但它们也可能更适合某些新任务。

一个新创造的基因可以帮助生物体对环境的变化做出反应。鳕鱼似乎就是这种情况,大约1500万年前北半球变冷时,鳕鱼获得了抗冻蛋白。

 

从头产生新基因

基因可以从非编码部分进化而来,通过获得转录和密码子,以任何一种顺序。起初,这些“原始基因”的产物可能功能失调或紊乱。


图片来源(Levy et al. Nature, 2019)
 

基因产生频率

为了追踪一个生物体的哪个基因是从头制造的,研究人员需要该生物体的基因组序列及该生物的近亲。一种符合要求的作物是水稻。海南是中国南部的一个热带岛屿,炎热的天气是种植这种作物的最佳环境——尽管工作条件艰苦但还可以试试。伊利诺伊州芝加哥大学的进化遗传学家袁满·朗说:“这太可怕了。”。“你可以在沙子里煮鸡蛋”太热了。

Long的团队想知道在粳稻品系中有多少基因重新出现,以及这些基因可能制造什么蛋白质。因此,该团队将其基因组与其近亲的基因组进行比对,并使用一种算法来挑选某些物种中含有基因但另一些物种中缺乏基因的区域。这使得研究人员能够识别导致该基因的非编码基因,并追踪其成为基因的历程。他们还可以计算出该菌株中出现的新基因的数量:经过340万年的进化,共有175个基因(同期,该菌株通过复制获得了8倍的基因)。

这项研究触及了该领域最大的关注点之一:如何辨别一个基因是否真的是新的。答案千差万别,方法仍在发展。例如,一项早期研究在整个灵长类中发现了15个新基因;后来的一次尝试仅在人类身上就发现了60个。寻找候选从头基因的一个选择是使用一种算法在相关物种中寻找相似的基因。如果什么都没有出现,那么基因有可能会重新出现。但是找不到亲属并不意味着没有亲属:基因可能在这一过程中丢失,或者可能在远离其亲属的地方发生了变形。水稻研究通过明确识别成为新基因的非编码脱氧核糖核酸片段绕过了这一点。

在漫长的进化时间尺度上——比几百万年的水稻进化时间长得多——很难区分一个新基因和一个简单的分化基因。Tautz说,离它的祖先太远,无法辨认,所以确定从头产生而不是复制的基因的绝对数量“是一个几乎无法回答的问题”。

为了证明不同方法的结果会有多不同,德克萨斯A&M大学学院站的进化遗传学家克劳迪奥·卡索拉使用了替代方法来重新分析先前的研究结果,但未能验证他们提出的40%的新生基因。对卡索拉来说,这表明需要标准化测试。他说,目前,“这似乎非常不一致”。

计算人类基因组中的新基因也有同样的注意事项。但是在发现新基因的地方,研究人员开始探索它们在健康和疾病中的作用。张和他的同事发现一个独特的基因在阿尔茨海默病患者的大脑中的表达水平更高,以前的研究已经将该基因的某些变异与尼古丁依赖联系起来。对张来说,将新生基因与人脑联系起来的研究是诱人的。“我们知道让我们成为人类的是我们的大脑,”他说,“所以必须有一些基因工具来推动我们大脑的进化。”这为未来的研究提供了一条途径。张建议研究人员可以通过人体器官样细胞的实验来研究基因试剂盒,人体器官样细胞是一种模型器官。

新生基因也可能对理解癌症有促进作用。一个这样的基因——人类和黑猩猩独有的——已经与成神经细胞瘤小鼠模型中的癌症进展相关联。人类乳头瘤病毒的致癌版本包括一种不以非致癌形式存在的基因。许多新生基因仍然没有特征,因此这个过程对健康和疾病的潜在重要性尚不清楚。“我们还需要一段时间才能完全理解它对人类健康的贡献和对人类起源的贡献,”卡鲁尼斯说。

尽管新生基因仍然是个谜,但它们的存在清楚地表明了一件事:进化可以从无到有地创造一些东西。卡索拉说:“研究新基因的好处之一是它展示了基因组的动态性。”

 

<更多精彩,可关注微信公众号:AIPuFuBio,和大型免费综合生物信息学资源和工具平台AIPuFu:www.aipufu.com>

posted @ 2019-11-14 16:07  AIPuFu  阅读(539)  评论(0编辑  收藏  举报