初学生信——测序技术及其原理
参考:
https://zhuanlan.zhihu.com/p/190757472
二代测序
第二代高通量测序也称为下一代测序技术,相比于第一代测序通量更高、速度更快、成本更低,主要有样本制备、文库构建、测序反应等过程。
一、常用概念
泳池(flowcell):如图所示,测序反应就发生在其上面
泳道(lane):泳池上面的八条线,每一条“泳道”的内表面都做了专门的化学装饰,主要有两种DNA引物(如图所示:黄绿两种)这两种DNA引物的序列和接下来要测序的DNA文库的街头序列是互补的。这两种DNA引物是种植在“泳道”内表面的。
如何种植在泳道内表面:通过共价键连接到内表面
为什么要连接在内表面:以为在后续的测序过程中会有大量液体要流过“泳池”,如果不将它连接在上面,这些液体就会将它冲走
二、建库
DNA文库:许多两头接上了特定接头的DNA片段混合物
特定接头:人为特地加上去的已知序列,和上面种植在“泳池内表面的引物序列是互补的”
1、首先把基因组DNA用超声波打断;
2、打断之后会出现末端不平整的情况,所以我们先要将它补齐成平末端;
3、补平之后要在3’端使用klenow酶加上一个特异性碱基A;
4、加上A之后就可以用连接酶加上特异性接头:
5、连好了接头的DNA混合物我们就称为DNA文库;
6、然后进行PCR扩增,以保证DNA样品浓度能够达到上机的要求。
三、桥式PCR扩增
桥式PCR:把DNA文库种植在flowcell上,然后进行PCR扩增的过程。因为文库DNA片段两头的特异性接头和种植在泳道上的引物是互补的,所以会产生互补杂交。
1、首先把文库加入到flowcell上,等文库和flwcell上的引物杂交完之后加入dNTP和聚合酶,就会以文库为模板合成一条新的互补链
2、在flowcell中加入NaOH碱溶液使得DNA双链解旋,然后文库那条链会被冲走,新合成的链由于与种植在泳道内表面的引物连接,所以会被保留下来。
3、在flowcell中加入中性溶液中和碱液,是环境变为中性,这时DNAl链上的另外一端会弯曲下来与另一个引物发生互补杂交,再加入聚合酶和dNTP,聚合酶沿着第二个引物,合成出一条新的链。
4、再加入碱液,使两条链解开,然后再加入中和液,两条DNA单链会和新的引物杂交互补,再加入酶和dNTP,又从新的引物合成新的链。
5、连续重复第四步,DNA链的数量就会以指数方式增长。
6、在桥式PCR完成之后,要把合成的双链变成可以测序的单链,可以通过化学反应把一个引物上的一个特定基团切掉,然后加入碱液使双链解旋,切断了的那根DNA链就会被冲走,这样就得到单链。再加入中性溶液,中性溶液中加入测序引物就可以开始测序了。(桥式扩增后,反向链会被切断洗去,仅仅留下正向链条,为防止特异性结合重新形成单链桥,3‘端被封锁)
四、测序 sequence
1、在flowcell中加入荧光标记的dNTP和酶,由引物起始开始合成子链。
2、dNTP存在3’端叠氮基团会阻碍子链延伸,这使得每个循环只能测得一个碱基。
3、合成完一个碱基后,flowcell通入溶液洗掉多余的dNTP和酶,使得显微镜的激光扫描特征荧光信号。加入的4种dNTP所标的荧光素都不一样,根据红黄蓝绿判断加入的是哪种碱基,然后得出与它互补的DNA链上的碱基,这就完成了一个循环。
4、荧光发射波长与信号强度一起决定了碱基的读出,所有的DNA片段的一个碱基会被同时读取,在大规模并行的过程中,机器读取的图形类似下面这样:
5、一个循环结束之后就加入一些化学试剂把叠氮基团和标记的荧光基团切掉,使得3‘端的羟基暴露出来,再加入新的dNTP和聚合酶开始第二轮循环。不断重复这个过程,就可以将文库DNA片段一端的序列读取出来,称为“reads1”