【翻译】GWAS教程:质量控制和统计分析【第四部分:附录-名词解释】
原文标题:A tutorial on conducting genome-wide association studies: Quality control and statistical analysis
原文链接:https://pubmed.ncbi.nlm.nih.gov/29484742/
附 | 名词解释
聚集(Clumping):一个过程,其中仅识别和选择每个LD块中最重要的SNP(即最低p值)以进行进一步的分析。这降低了剩余SNP之间的相关性,同时保留了具有最强统计证据的SNP。
共同遗传性(Co-heritability):衡量疾病之间遗传关系的指标。基于SNP的遗传性是由SNP解释的疾病对(例如精神分裂症和双向情感障碍)之间的协方差比例。
基因(Gene):DNA中编码分子(例如蛋白质)的核苷酸序列。
杂合性(Heterozygosity):指两个不同等位基因对特定SNP的携带。个体的杂合率是杂合基因型的比例。个体内高水平的杂合性可能表明样本质量低,而低水平的杂合性可能是由于近亲繁殖。
个体层面的缺失(Individual-level missingness):指特定个体缺失SNP的数量。大量的缺失可以认为揭示了DNA样本质量较差或者技术上的问题。
连锁不平衡(Linkage disequilibrium, LD):对给定群体中同一染色体中不同位点等位基因之间非随机关联的衡量。当SNP等位基因的关联概率高于随机分类下的预期时,SNP处于连锁不平衡状态。LD关注SNP之间的相关性模式。
次要等位基因频率(Minor allele frequency, MAF):在特定位置上最不常出现的等位基因的频率。大多数研究不足以检测与低MAF的SNP的关联,因此这些SNP需要被排除。
种群分层(Population stratification):指的是研究中出现多个亚群的情况(例如,具有不同种族背景的个体)。由于等位基因频率在不同的亚群之间可能是不同的,因此种群分层可能导致假阳性关联以及/或者掩盖真实关联。一个很好的例子是筷子基因(chopstick gene),由于种群分层,单个SNP占筷子进食能力差异的近一半(Hamer和Sirota,2000年)。
修剪(Pruning):一种选择处于近似连锁平衡的标记子集的方法。在PLINK中,该方法使用染色体特定窗口(区域)内SNP之间的LD强度,并根据用户指定的LD阈值仅选择近似不相关的SNP。与Clumping相反,Pruning不考虑SNP的p值。
相关性(Relatedness):表明一对个体在遗传上的相关性强度。传统的GWAS假设所有受试者都是不相关的(即没有任何一对个体比二级亲属(second-degree relatives)更密切相关)。如果没有经过适当的校正,包括亲属可能会导致对SNP效应大小的标准误差的估计有偏差。请注意,已经开发了用于分析家庭数据的特定工具。
性别差异(Sex discrepancy):制定性别与基于基因型确定的性别之间的差异。这个差异可能表明了实验室中的样品存在混淆。请注意,只有在评估了性染色体(X和Y)上的SNP后才能进行此测试。
单核苷酸多态性(Single nucleotide polymorphism, SNP):发生在基因组特定位置的单个核苷酸(即A、C、G或T)的变异。SNP通常以两种不同的形式存在(例如,A与T)。这些不同的形式被称为等位基因。具有两个等位基因的SNP具有三种不同的基因型(例如AA、AT和TT)。
SNP遗传力(SNP-heritability):分析中所有SNP解释的性状表型变异的分数。
SNP层面的缺失(SNP-level missingness):样本中特定SNP信息缺失的个体数量。高度缺失SNP情况的存在可能会导致偏差。
汇总统计(Summary statistics):进行GWAS之后获得的结果,包括有关染色体数量、SNP位置、SNP(rs)-标识符、MAF、效应大小(odds ratio/beta)、标准差和p值等信息。GWAS的汇总统计数据通常可以免费获取或在研究者之间共享。
哈代-温伯格平衡\不平衡(HWE)定律:这涉及到等位基因和基因型频率之间的关系。它假设一个无限大的种群,没有选择、突变或迁移。定律规定基因型和等位基因频率在几代人中是恒定的。违反HWE定律表明基因型频率与预期显著不同(例如,如果等位基因A的频率=0.20、等位基因T的频率=0.80;基因型AT的预期频率为2*0.2*0.8=0.32)和观察到的频率不应有显著差异。在GWAS中,通常假设与HWE的偏差是基因型分型错误的结果。cases中的HWE阈值通常不如controls中的严格,因为在cases中违背HWE定律可能表明与疾病风险的真正遗传关联。
补充
2021.7.6
后面还有一章讲PRS的,暂时就不翻译了,如果什么时候用上PRS才会翻吧;接下来可能会翻一些GWAS相关软件工具包的实现原理论文
本文来自博客园,作者:Minerw,转载请注明原文链接:https://www.cnblogs.com/minerw/p/gwas-tutorial-translate-part4.html