GWAS(Genome-Wide Association Study) 全基因组关联分析
https://www.cnblogs.com/leezx/p/9013615.html
https://www.youtube.com/watch?v=LGevar2v_3c
作用:
虽然大多数的SNP是中性的,但是一些SNP和疾病有关,用GWAS找到和疾病有关的SNP
基因组和SNP的关系:
- 基因组(Genome)是一个生物体的所有遗传信息的总称,它包含了所有的基因以及其他非编码DNA序列。基因组是生物体遗传特征和功能的基础。
- SNP(Single Nucleotide Polymorphism,单核苷酸多态性)是基因组中最常见的遗传变异形式之一。它是指基因组中的单个核苷酸位置发生的单个碱基的变异,例如,一个位置上的碱基可以是A、T、C或G中的任意一个。
思想:
当进行GWAS时,我们分析的数据通常是人类基因组中的遗传变异数据和相关表型数据。
遗传变异数据通常是单核苷酸多态性(SNP)位点的基因型信息,这些位点在人类基因组中的位置是已知的。
GWAS的目标是探索这些遗传变异与特定表型(如疾病风险、药物反应等)之间的关联。我们希望找到与某个特定表型相关的遗传变异。
说人话:分析实验组和对照组SNP和表型的关系
结果:现在可以对数百万个SNP位点进行分析,通过GWAS分析,我们可以识别出与特定表型相关的SNP位点。
步骤:
确定研究对象和目标:
- 确定要研究的性状或疾病,并选择相应的研究对象。
设置对照组,一组是正常人,一组是包含某种疾病的人
数据收集和基因分型:
- 收集研究对象的基因组DNA样本,进行基因分型,收集每一个参与者的基因组遗传变异情况,即SNP,
- 通常是通过基因芯片或高通量测序技术获得。
数据质量控制:
- 对基因型数据进行质控和数据清洗,包括去除低质量的SNP位点和个体,纠正样本间的亲缘关系或种族结构等
关联分析:
- 使用统计方法来评估基因型和表型之间的关联。常用的方法包括卡方检验、线性回归、逻辑回归等。对每个SNP位点进行单点关联分析,评估其与表型特征之间的相关性。
- *计算基因频率
- 每一种颜色,都是人类染色体之一,通过对比患病组和正常组,发现在某个三条染色体的基因组中,SNP很多,推测这三条染色体的某个区域可能和疾病有关,这就是关联分析
-
校正和复现:
- 校正分析结果,纠正可能的偏倚或混杂因素,并尝试在不同的独立样本集中复现关联结果。
结果解读和功能注释:
- 对关联结果进行解读和功能注释,尝试理解相关基因的功能和生物学意义。
- GWAS是一个起点,知道了应该从哪里去分析
疑惑:
1. 选定的SNP,患病的上面有,正常的上面也有,或者患病的上面没有,正常的上面也没有、或者一个有,一个没有。可以确定选定的SNP和合表型有关联吗?
应该是的
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!