04 2019 档案

摘要:PLINK提供了“--ld”的参数计算两个SNP位点的连锁不平衡值。 命令如下: 生成如下数据: --ld rs123 rs134: R-sq = 0.0313386 D' = 1 Haplotype Frequency Expectation under LE TG 0 0.022549 CG 0 阅读全文
posted @ 2019-04-29 16:11 橙子牛奶糖 阅读(5796) 评论(0) 推荐(1) 编辑
摘要:前言 关于选用多少个PCA做群体分层校正,各大期刊并没有一个统一的说法。 故做了如下综述。 1 随心所欲型,想选多少就选多少 PCA想选多少就选多少,这个真的不是开玩笑。有文献出处有真相! 比如下面文献直接选用10个PCA校正群体分层。 Largest GWAS of PTSD (N=20070) 阅读全文
posted @ 2019-04-27 12:52 橙子牛奶糖 阅读(2272) 评论(0) 推荐(1) 编辑
摘要:一、前言 大约几年以前,我曾经跟别人吹过牛逼,说我会深度学习。吹牛的后果就是我得逼自己把深度学习放在我的to-do-list里,在别人揭发我吹牛之前把深度学习学会了,才能名正言顺得对外宣称,我并没有吹牛。 下面正式进入主题,如何从一名小白跨越到高手:第一步是先学会安装深度学习所需的应用软件PyCha 阅读全文
posted @ 2019-04-15 19:17 橙子牛奶糖 阅读(742) 评论(0) 推荐(1) 编辑
摘要:一、什么是多基因风险评分 传统的GWAS研究只计算单个SNP位点与表型之间的关联性,再用Bonferroni校正,通过给定的阈值,筛选出显著的SNP位点。 这样会存在两个问题,第一、Bonferroni校正非常严格,很多对表型也有贡献的位点会因为达不到阈值而被过滤掉。第二、单个位点对表型的解释度是很 阅读全文
posted @ 2019-04-11 10:59 橙子牛奶糖 阅读(17928) 评论(1) 推荐(3) 编辑
摘要:一、为什么要校正case和control数量比例不平衡情况 试问作为生信届人员,最怕的是什么,当然是统计结果不靠谱。统计结果不靠谱包括两方面:一个是假阴性,一个是假阳性。假阴性可以理解为白天鹅被误当成丑小鸭了,假阳性可以理解为一大堆青蛙,你不知道哪个才是你的真命天子。假阴性就罢了,最多让你错过发现真 阅读全文
posted @ 2019-04-02 11:49 橙子牛奶糖 阅读(3973) 评论(7) 推荐(3) 编辑

点击右上角即可分享
微信分享提示