上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 49 下一页
摘要: 为什么需要做meta分析 群体分层是GWAS研究中一个比较常见的假阳性来源. 也就是说,如果数据存在群体分层,却不加以控制,那么很容易得到一堆假阳性位点。 当群体出现分层时,常规手段就是将分层的群体独立分析,最后再做meta分析。 1.如何判断群体是否分层 先用plink计算PCA,具体方法详见链接 阅读全文
posted @ 2019-05-23 16:09 橙子牛奶糖 阅读(6247) 评论(2) 推荐(3) 编辑
摘要: 修改正负链用到的参数为 假定trial.bim的内容如下: trial.bim 1 rs142578063 0 732746 G A 1 rs144022023 0 732801 G A 1 rs12131618 0 732809 C T 1 rs369225293 0 732909 A G 1 r 阅读全文
posted @ 2019-05-21 10:25 橙子牛奶糖 阅读(1086) 评论(0) 推荐(2) 编辑
摘要: 一般来说,常见变异影响常见疾病,罕见变异影响罕见疾病。 常见疾病/表型(比如糖尿病、身高),一般都是由许多微效作用位点共同影响的。 罕见疾病(比如家族性乳糜微粒血症综合征),一般由一个或几个效应值极强的罕见变异影响。 比如下面这个图,就很好的说明了这个问题。 " " 但是,世界不是非黑即白,凡事都有 阅读全文
posted @ 2019-05-16 16:05 橙子牛奶糖 阅读(1158) 评论(0) 推荐(1) 编辑
摘要: 在全基因组关联分析中,处理芯片数据时,必须走的一个流程就是基因型数据填充(imputation)。 当然,如果你拿到的是全测序的数据,请忽略这一步。 下面直奔主题,怎么在网页版进行基因型填充。 1 进入 "Michigan Imputation Server" Michigan Imputation 阅读全文
posted @ 2019-05-08 10:15 橙子牛奶糖 阅读(3098) 评论(5) 推荐(1) 编辑
摘要: PLINK提供了“--ld”的参数计算两个SNP位点的连锁不平衡值。 命令如下: 生成如下数据: --ld rs123 rs134: R-sq = 0.0313386 D' = 1 Haplotype Frequency Expectation under LE TG 0 0.022549 CG 0 阅读全文
posted @ 2019-04-29 16:11 橙子牛奶糖 阅读(5733) 评论(0) 推荐(1) 编辑
摘要: 前言 关于选用多少个PCA做群体分层校正,各大期刊并没有一个统一的说法。 故做了如下综述。 1 随心所欲型,想选多少就选多少 PCA想选多少就选多少,这个真的不是开玩笑。有文献出处有真相! 比如下面文献直接选用10个PCA校正群体分层。 Largest GWAS of PTSD (N=20070) 阅读全文
posted @ 2019-04-27 12:52 橙子牛奶糖 阅读(2233) 评论(0) 推荐(1) 编辑
摘要: 一、前言 大约几年以前,我曾经跟别人吹过牛逼,说我会深度学习。吹牛的后果就是我得逼自己把深度学习放在我的to-do-list里,在别人揭发我吹牛之前把深度学习学会了,才能名正言顺得对外宣称,我并没有吹牛。 下面正式进入主题,如何从一名小白跨越到高手:第一步是先学会安装深度学习所需的应用软件PyCha 阅读全文
posted @ 2019-04-15 19:17 橙子牛奶糖 阅读(741) 评论(0) 推荐(1) 编辑
摘要: 一、什么是多基因风险评分 传统的GWAS研究只计算单个SNP位点与表型之间的关联性,再用Bonferroni校正,通过给定的阈值,筛选出显著的SNP位点。 这样会存在两个问题,第一、Bonferroni校正非常严格,很多对表型也有贡献的位点会因为达不到阈值而被过滤掉。第二、单个位点对表型的解释度是很 阅读全文
posted @ 2019-04-11 10:59 橙子牛奶糖 阅读(17581) 评论(1) 推荐(3) 编辑
摘要: 一、为什么要校正case和control数量比例不平衡情况 试问作为生信届人员,最怕的是什么,当然是统计结果不靠谱。统计结果不靠谱包括两方面:一个是假阴性,一个是假阳性。假阴性可以理解为白天鹅被误当成丑小鸭了,假阳性可以理解为一大堆青蛙,你不知道哪个才是你的真命天子。假阴性就罢了,最多让你错过发现真 阅读全文
posted @ 2019-04-02 11:49 橙子牛奶糖 阅读(3832) 评论(7) 推荐(3) 编辑
摘要: GWAS研究中,表型分两种。第一种是线性的表型,如果身高、体重、智力等;第二种是二元的表型,比如患病和未患病,即通常所说的case和control。对于表型是线性的样本来说,是不存在case和control比例不平衡的情况的,但是对于表型是二元的样本,比如疾病和对照组(健康人群),case和cont 阅读全文
posted @ 2019-03-29 14:38 橙子牛奶糖 阅读(4907) 评论(5) 推荐(2) 编辑
上一页 1 ··· 28 29 30 31 32 33 34 35 36 ··· 49 下一页