三代测序技术简介
第三代测序技术是指单分子测序技术,在测序过程中不需要涉及PCR扩增,实现了对每一条DNA分子的单独测序。三代测序技术具有超长读长,还拥有不需要模板扩增、运行时间较短、直接检测表观修饰位点、较高的随机测序错误等特点。它弥补了第二代测序读长短、受GC含量影响大等局限性,已在小型基因组从头测序和组装中有较多应用。
目前比较有代表性的三代测序平台公司有三家,分别是Pacific Biosciences(PacBio)公司的单分子实时测序技术、Oxford Nanopore公司的单分子纳米孔测序技术、和Helicos公司的真正单分子测序技术tSMSTM。
Helicos,Oxford Nanopore,Pacific Biosciences
Helicos,是第三代测序仪的先驱,它生产了第一台单分子测序仪HeliScope,真正实现了单分子测序。但其高达99.9万美元的售价阻碍了它的推广,到2012年11月中旬,Helicos正式宣布破产。
Oxford Nanopore,2012年2月份,Oxford Nanopore发布了一系列纳米孔DNA测序和蛋白质分析数据,并向外界展示了它的GridION TM系统和MinIONTM设备,但产业化仍未实现。
- Nanopore纳米孔测序的基本原理是:
在充满了电解液的纳米级小孔两端加上一定的电压(一般为100~120 mV)时,可以很容易地测量通过此纳米孔的电流强度。纳米孔的直径非常细小(约2.6 nm),只能允许 单个核苷酸通过,在核苷酸通过时,纳米孔被核苷酸阻断,通过的电流强度随之变弱。
由于4种核苷酸碱基的带电性质不同,它们在通过纳米孔时,被减弱的电流强度变化程度也就有所不同。这样,由多个核苷酸组成的长链DNA或者RNA在电场的作用下由负极向正极方向移动并通过纳米孔时,检测通过纳米孔的电流强度变化,即可判断通过纳米孔的核苷酸种类,从而实现了实时测序。
Pacific Biosciences,是目前市场接受度和使用度最高的三代测序仪,它以SMRT Cell为测序载体进行测序反应。
SMRT Cell是一张厚度为100 nm的金属片,一面带有15万个(2014年数据)直径为几十纳米的小孔,称为零模波导(zero-mode waveguide,ZMW),也可以简称为纳米孔。测序时,系统将测序文库、DNA聚合酶和带有不同荧光标记的dNTP放置到纳米孔的底部进行DNA合成反应。DNA聚合酶分子通过共价结合的方式固定在纳米孔底部,通常一个纳米孔固定一个DNA聚合酶分子和一条DNA模板。加入DNA聚合反应所需底物——4种带有四色荧光标记基团的dNTP及缓冲液。根据模板链核苷酸顺序,相应的dNTP进入DNA模板链、引物和聚合酶复合物中发生链延伸反应,同时通过检测dNTP荧光信号,获得荧光信号图像,经计算分析获得DNA碱基顺序。每个SMRT Cell大约可以同时进行12万个以上的单分子测序反应。
- Pacbio核心技术:
第一,零模波导孔技术(Zero-Mode Waveguides,ZMWs)让光只能照亮固定了单个DNA聚合酶/模板分子的纳米孔底部。
第二,磷酸化的核苷酸可帮助固定的DNA聚合酶完成一个全天然的DNA链合成过程。
Pacbio测序仪比较
到目前为止,PacBio公司基于SMRT测序技术共推出了三款测序仪。
- 第一款产品PacBio RS在2011年正式发布并商用;
- 2013年4月发布了升级版PacBio RS Ⅱ;
- 2015年10月推出全新升级的三代测序仪PacBio Sequel测序系统。
目前RS系统已停止生产,国内很多公司正在积极引进的Sequel平台,其原理与RS II System相同,但是测序通量和数据质量有了大幅提高。新平台的引进与应用还需要一段时间,因此目前市面上使用最广泛的仍然是RS II System。
PacBio三代测序基本流程
PacBio三代测序的优势
- 超长读长:PacBio Sequel平台最大读长能达到70kb,平均读长12~15kb,能够完美跨越高重复区域和高复杂区域,减少拼接成本。。
- 一致性序列准确:通过reads的自我矫正,30X以上准确率能够达到99.999%。PacBio平台上目前的错误主要是插入和缺失,只有大概1%是substitution。缺失错误源自于有时候碱基掺入速度过快,超过了PacBio相机的拍摄帧数。插入错误源自于有的时候酶随机的选择一些碱基,但并未将这些碱基真的掺入合成链中。由于这些错误是随机的,因而可以随着测序覆盖深度的增加而消除。因此,尽管PacBio的单分子单次读取的原始准确度并不非常高,但随着测序覆盖深度的增加,它可以获得比NGS平台更高的一致性准确度。
- 均匀的覆盖:无需PCR 扩增,避免了覆盖度不均一和PCR 冗余,完全跨过高GC 含量区域,实现对整个基因组的均匀覆盖。
- 直接检测碱基修饰:可以直接检测到甲基化信息,同步进行表观遗传学性别识别。当碱基有额外修饰时,DNA聚合酶的合成速度会减慢,对应的信号会被检测出来。每种碱基修饰事件都会使聚合酶的“停顿模式”PacBio Sequel产生微小差异,最终反映到荧光脉冲信号的间隔上。除了甲基化修饰,还可以检测5-hC、5-hmU、5-hU、1-mA、6-mA、8-oxoA、BPDE、6-mT、6-mG等碱基修饰,甚至可以鉴别传统亚硫酸氢盐测序法无法区分的甲基化修饰和羟甲基化修饰。PacBio Sequel平台可以在测序的同时即可检测表观遗传学修饰信息,只需对测序数据选择合适的软件即可分析碱基修饰信息。
- 以单分子分辨率表征复杂群体:为区分同一样本中序列相近的DNA分子产生了分子内的一致性序列的测序模式,称为环状一致性测序(CCS),可用于用于各种复杂群体的应用,还有iso-seq。
PacBio分析应用
1、从头组装
2、重测序和变异检测
3、RNA测序
4、表观遗传
5、多重分析
参考