摘要:
每一个物种的参考基因组序列(reference genome)的产生都要先通过测序的方法,获得基因组的测序读段(reads),然后再进行从头拼接或组装(英文名称为do novo genome assembly),最后还原测序物种的各条染色体的序列,即ATGC四种碱基的排列顺序。之所以要进行基因组拼接,是因为现在的测序技术还只能测较短的序列,无法直接获取一整条染色体的序列。如一代测序(Sanger测序)一般可测1kb左右的序列;二代测序(next-generation sequencing),一般可测50~500bp;三代测序虽然可测100kb甚至更长的序列,但现在三代测序技术还不是很成熟,还有较高的测序错误率。 阅读全文
摘要:
因为结构变异是造成物种表型差异的一个重要原因,且与各类疾病,特别是癌症的发生、发展紧密相关,因此研究结构变异非常重要。结构变异通常是指长度大于1Kb的基因组序列变异,包括多种不同的类型:插入(insertion)、缺失(deletion)、反转(inversion)、异位(translocation)、拷贝数变异(copy number variation,CNV或者duplication)。今天给大家介绍结构变异的种类及基于基因组测序数据的鉴定方法。 阅读全文
摘要:
肿瘤基因组图谱 (The Cancer Genome Atlas,TCGA) 计划是由美国国家癌症研究院(National Cancer Institute,NCI)和美国国家人类基因组研究所(National Human Genome Research Institute,NHGRI)于2006年联合启动的项目,目前共计研究33种癌症类型。TCGA利用大规模测序为主的基因组分析技术,从基因组、表观遗传组、转录组、蛋白质组等多个层析解析癌症的分子机制。最终完成一套完整的与所有癌症基因组改变相关的图谱以提高人们对癌症发病分子基础的科学认识及提高我们诊断、治疗和预防癌症的能力。作为目前最大的癌症基因信息的数据库,TCGA蕴藏着难以想象的宝贵信息。 阅读全文
摘要:
单核苷酸多态性,英文single nucleotide polymorphism,缩写为SNP,读音为Snip。SNP主要是指在基因组水平上引起的单个碱基的变异,其在群体中的发生频率不小于1%,包括单碱基的转换、颠换以及单碱基的插入和缺失等。突变(mutation)和多态性(polymorphism)的主要区别在于:1)突变在群体中的发生频率小于1%,而多态性的发生频率在大于1%;2)突变通常对生生物体是有害的,而多态性通常都是无害的。 阅读全文
摘要:
目前,单细胞转录组测序技术(scRNA-seq)已经广泛应用于各类物种,特别是人、小鼠等典型的模式生物。和单细胞转录测序技术相比,传统的转录组测序技术(bulk RNA-seq)是基于群体细胞开展的,每个样本都包含成千上万个细胞,所以传统转录组测序反映的是基因在群体细胞中平均的表达水平,从而无法有效检测不同细胞之间的表达异质性。 阅读全文
摘要:
自从第一代测序技术Sanger测序发明以来,使得人们可以不断在单碱基水平研究各物种的基因组序列。由于Sanger测序价格昂贵,测序通量低等劣势,2005年左右二代测序相继被开发出来,极大地降低了测序的价格和提升了测序的通量。现在测一个人的基因组序列,只需不到1000美元。测序可以在很多不同的层面开展,包括基因组层面、转录组层面、甲基化层面、免疫共沉淀测序等。今天我们重点讨论一下基因组层面的测序。基因组层面的测序主要可以分为三大类:全基因组测序(whole-genome sequencing,简称WGS)、全外显子测序(whole-exome sequencing,简称WES)、靶向测序(targeted sequencing或panel sequencing) 阅读全文
摘要:
DNA和蛋白存在各种修饰,RNA也不例外,目前已知的RNA修饰已经超过上百种。RNA根据编码性可分为编码RNA(protein-coding RNA)和非编码RNA(noncoding RNA)两大类,这些RNA转录后会发生各种修饰,包括N6-腺苷酸甲基化(N6-methyladenosine,m6A)、胞嘧啶羟基化(m5C)、N1-腺苷酸甲基化(m1A)等等。m6A甲基化是真核生物RNA中最常见的一种转录后修饰,大约占到了RNA甲基化修饰的80%左右。 阅读全文
摘要:
可变剪接(alternative splicing),在真核生物中是一种非常基本的生物学事件。即基因转录后,先产生初始RNA或称作RNA前体,然后再通过可变剪接方式,选择性的把不同的外显子进行重连,从而产生不同的剪接异构体(isoform)。这种方式,使得一个基因可产生多个不同的转录本,这些转录本分别在细胞/个体分化发育的不同阶段,在不同的组织中有各自特异的表达和功能,从而极大地丰富了编码RNA和非编码RNA种类和数量,进而增加了转录组和蛋白质组的复杂性。 阅读全文
摘要:
细胞状态(cell state)和细胞亚型(cell subtype)是两种不同的概念。一种类型的细胞,可进一步细分为不同的亚型(cell subtype),这些亚型是相对稳定的。而不同的细胞亚型受到外界刺激或扰动时,可能展现出不同的状态(cell state),这种状态是暂时。利用单细胞转录组测序(single-cell RNA-seq)技术对相应的样本进行测序后,就可基于单细胞测序数据具体研究不同细胞状态间的转换过程,中文常称作细胞轨迹的构建或拟时间序列的构建,英文叫cell trajectory/lineage and pseudotime reconstruction/inference。其中pseudotime,中文翻译为拟时间, 一种假定的时间序列。这种类型的单细胞测序数据分析,是根据细胞中基因的表达情况,将不同的细胞按照拟时间序列从开始转态、中间状态、终点状态来排列。从而能促进阐释细胞转态转换的潜在机制(更多精彩请关注微信公众号:AIPuFuBio)。 阅读全文
摘要:
近年来,单细胞转录组测序(single-cell RNA-seq,scRNA-seq)技术得到了蓬勃的发展,从而使得可在单细胞水平揭示全基因组范围内所有基因的表达情况,非常有利于研究细胞间的表达异质性。目前单细胞转录组测序技术(scRNA-seq)已经广泛应用于各类物种(特别是人、小鼠等)的不同类型组织和细胞系,包括正常和病变细胞等。自从2009年等由汤富酬等人开发出了第一种单细胞转录组测序技术,目前已经有几十种不同的单细胞转录组测序技术相继被开发出来,它们都有各自的特点,拥有特定的优势和缺点。为了正确利用相应的单细胞测序技术开展相关研究和应用,非常有必要充分了解这些不同技术的优缺点。 阅读全文