变异的一生 | all about variant
目录
变异的意义
变异的分类
突变的类型
变异对生命活动的影响
研究得较为透彻的一些变异
变异的未来研究趋势
做生物医学的,但凡视野宽一点就离不开变异,也离不开下游功能验证,这对于做传统遗传病的和最前沿癌症的工作者而言都一样。
变异的意义
多样性、自然选择、进化,以及不可避免的变异积累导致癌症。下面的一段话既有深度又颇具感性:
Genetic variation is fundamental to the evolution of all species and is what makes us individuals. Our genes have a large influence on our lives. They affect what we look like, our personalities and preferences and our susceptibility to disease. By studying genetic variation we hope to understand the molecular processes that contribute to life on earth.
几个重要的点:
Mutations are the original source of genetic variation.
In humans, recombination contributes to genetic variation by shuffling parental DNA and creating new combinations of variants.【每一次有性生殖都是洗牌shuffling】
The term variant is used to refer to a specific region of the genome which differs between two genomes.
Different versions of the same variant are called alleles.
A mendelian trait is one that is controlled by a single locus, for example a single SNP.
For complex phenotypes there may be multiple variants in the genome that increase or decrease the likelihood of an individual having a certain trait, along with environmental factors.
变异的分类
按出现频率分:common、rare、URV
按遗传与否分:somatic、germline
按碱基长度分:SNP、Indel、CNV、SV等。
按致病程度分:“致病的”、“可能致病的”、“意义不明确的”、“可能良性的”和“良性的”。
按基因组功能分:“g”为基因组序列, “c”为编码 DNA 序列, “p” 为蛋白质, “m”为线粒体
ACMG遗传变异分类标准与指南【详情见末尾文献】
PVS1: 功能丧失(LOF)型变异,属于无功能变异,包括无义突变、移码突变、经典的±1 或 ±2 的剪接突变、起始密码子变异、单个或多个外显子缺失。
PS1:与先前已确定为致病性的变异有相同的氨基酸改变。例如:同一密码子, G>C 或 G>T改变均可导致缬氨酸 →亮氨酸的改变。
PS2: 患者的新发变异, 且无家族史(经双亲验证)。
PS3: 体内、体外功能实验已明确会导致基因功能受损的变异。
PS4: 变异出现在患病群体中的频率显著高于对照群体。
PM1: 位于热点突变区域, 和/或位于已知无良性变异的关键功能域(如酶的活性位点)。
PM2:ESP数据库、千人数据库、EXAC数据库中正常对照人群中未发现的变异(或隐性遗传病中极低频位点)。
PM3: 在隐性遗传病中, 在反式位置上检测到致病变异。
PM4: 非重复区框内插入/缺失或终止密码子丧失导致的蛋白质长度变化。
PM5: 新的错义突变导致氨基酸变化, 此变异之前未曾报道, 但是在同一位点, 导致另外一种氨基酸的变异已经 确认是致病性的, 如: 现在观察到的是 Arg156Cys, 而 Arg156His是已知致病的。
PM6:未经父母样本验证的新发变异。
PP1: 突变与疾病在家系中共分离(在家系多个患者中检测到此变异)。
PP2:对某个基因来说,如果这个基因的错义变异是造成某种疾病的原因,并且这个基因中良性变异所占的比例很小,在这样的基因中所发现的新的错义变异。
PP3: 多种统计方法预测出该变异会对基因或基因产物造成有害的影响, 包括保守性预测、进化预测、剪接位点影响等。
PP4: 变异携带者的表型或家族史高度符合某种单基因遗传疾病。
PP5: 有可靠信誉来源的报告认为该变异为致病的, 但证据尚不足以支持进行实验室独立评估。
BA1:ESP数据库(Exome SequencingProject),千人数据库(1000 GenomesProject)及 ExAC数据库(Exome AggregationConsortium)中的等位基因频率大于5%的变异。
BS1: 等位基因频率大于疾病发病率。
BS2: 对于早期完全外显的疾病, 在健康成年人中发现该变异(隐性遗传病发现纯合、显性遗传病发现杂合, 或者X 连锁半合子)。
BS3: 在体内外实验中确认对蛋白质功能和剪接没有影响的变异。
BS4: 在一个家系成员中缺乏共分离。
BP1: 已知一个疾病的致病原因是由于某基因的截短变异, 在此基因中所发现的错义变异。
BP2: 在显性遗传病中又发现了另一条染色体上同一基因的一个已知致病变异, 或者是任意遗传模式遗传病中又发现了同一条染色体上同一基因的一个已知致病变异。
BP3: 功能未知重复区域内的缺失/插入, 同时没有导致基因编码框改变。
BP4: 多种统计方法预测出该变异会对基因或基因产物无影响, 包括保守性预测、进化预测、剪接位点影响等。
BP5: 在已经有另一分子致病原因的病例中发现的变异。
BP6: 有可靠信誉来源的报告认为该变异为良性的, 但证据尚不足以支持进行实验室独立评估。
BP7: 同义变异且预测不影响剪接。
突变的类型
突变mutation,特指variant的一种,即单碱基的变异,按突变的功能影响主要分为如下几种类型。
同义突变synonymous mutation:由于遗传密码子存在简并性,碱基置换后密码子虽然发生改变,但所编码的氨基酸没有改变。
错义突变missense mutation:碱基置换后编码某个氨基酸的密码子变成另一种氨基酸的密码子,从而改变多肽链的氨基酸序列,影响蛋白质的功能。
无义突变nonsense mutation:碱基置换后使原本编码氨基酸的密码子变成不编码任何氨基酸的终止密码子(UAG、UAA或UGA),使得多肽链的合成提前终止,肽链长度变短而成为无活性的截短蛋白。
终止密码子突变:与无义突变相反,碱基替换后使某一终止密码子变成具有氨基酸编码功能的遗传密码子,使本应终止延伸的多肽链合成异常地持续进行。终止密码子突变会使多肽链长度延长,其结果也必然形成功能异常的蛋白质结构分子。
移码突变:也称框移突变,由于编码序列中插入或缺失一个或几个碱基,使得插入或缺失点下游的三联密码子组合发生改变,造成突变点以后的全部氨基酸序列发生改变。移码突变引起蛋白质多肽链中的氨基酸组成和顺序发生多种变化,且都没有生物学活性。
剪切位点突变:转录的过程中会发生剪切,GT……AG是经典剪切位点, 某一位点突变会影响剪切。
动态突变:某些单基因遗传形状的异常或疾病的发生,是由于DNA分子中某些短串联重复序列,尤其是基因编码序列或侧翼序列的三核苷酸重复扩增引起。
基因突变的命名规则和表示方法
基因组参考序列(以前缀“g.”表示)
cDNA参考序列(以前缀“c.”表示)
非编码DNA参考序列 (以前缀“n.”表示)
RNA参考序列(以前缀“r.”表示)
蛋白质参考序列(以前缀“p.”表示)
置换(>):一个核苷酸被另一个核苷酸替代,使用“>”来表示;例如g.1318G>T;
缺失(del):一个或多个核苷酸被移除,使用“del”进行描述;例如g.3661_3706del;
倒置(inv):与原始序列反向互补的新的核苷酸序列(大于1个核苷酸)替换原始序列;例如由CTCGA变为TCGAG,使用”inv“表示;
重复(dup):一个或多个核苷酸拷贝直接插入原始序列的下游,使用“dup”表示;
插入(ins):序列中插入一个或多个核苷酸,并且插入序列并非上游序列拷贝;
缺失-插入(delins/indel):一个或多个核苷酸被其他核苷酸替代,但并不是发生替代、倒置和转置;
转换(con):一种特殊类型的缺失-插入,其中替代原始序列的核苷酸序列是来自基因组中另一个位点的序列拷贝。
研究得较为透彻的一些变异
靶向药物就是针对某个基因突变特别有效的药物,以肺癌来说,EGFR突变的患者,使用针对EGFR的靶向药物,平均生存时间能达到3年左右。
编码区变异
非编码区变异
UTR区变异
镰状细胞贫血(sickle cell anemia, SCA)是由11号染色体(11p 15.4)上独特的血红蛋白基因纯合性突变[HBB glu7val, GAG->GTG, rs334;镰状血红蛋白(sickle hemoglobin, HbS)]引起。
待续~
参考:
《ACMG遗传变异分类标准与指南》中文版发布,中国进入临床遗传咨询标准化时代
英文版:www.ncbi.nlm.nih.gov/pmc/articles/PMC4544753
中文版:http://medi-guide.meditool.cn/ymtpdf/C81F23E3-5AEA-EC33-490E-53912AAD33D3.pdf
Human genetic variation - An introduction
Guidelines for Human Gene Nomenclature