高通量测序中,reads、contigs、scaffold之间的联系
read:测序时,产生的较短的原始序列叫read
contigs:有多个reads通过片段的重叠,组装成一个更大的read,称为contigs
scaffold:多个contigs通过片段的重叠拼接成更长的scaffold;
从上面的解释来看,可以发现这些命名应该比价常出现在de novo拼接当中。
一个contigs组装之后,鉴定发现是编码蛋白的基因,就叫做singleton
scaffold,经鉴定发现它是编码蛋白的基因,就叫做unigene