摘要:
全基因组关联分析除了找到显著的关联位点,我们还可以做基因优化、geneset富集分析、组织富集分析,下面具体讲一讲怎么利用GWAS的summary数据做这个分析。 summary数据就是关联分析的结果文件 1 软件安装前请确保需要满足的系统环境 1.1 支持Mac OS X 或者 UNIX, 不支持 阅读全文
摘要:
目前GWAS方向发了很多文献,但是并没有一个很完善的R包对这些文献的数据进行汇总。 接下来推荐的这个是最新发表的GWAS数据汇总R包。看了一下功能齐全,但是数据不是收录的很齐全。 下面具体讲一下。 在R上安装 查询是否有发表关于自身免疫性疾病的文章 提取显著信号位点信息 获取含有rs12752 阅读全文
摘要:
这篇文章是对之前 "啊啊救救我,为何我的QQ图那么飘(全基因组关联分析)" 这篇文章的一个补坑。 LD SCore除了查看显著SNP位点对表型是否为基因多效性外,还额外补充了怎么计算表型的遗传度和遗传相关性。 1 下载、安装ldsc 2 安装ldsc依赖的环境 3 测试是否安装成功 如果安装成功,输 阅读全文
摘要:
在合并数据过程当中,经常会发现不同来源的数据正负链不是统一的,这是一件很头疼的事。 正负链没有统一的情况下直接合并在一起会产生什么后果呢。 举个最简单的例子,假如我们从小明和小红分别拿到了一批基因型数据。那么存在以下几种可能:1)小明的基因型数据统一好正链或者负链;2)小红的基因型数据统一好正链或者 阅读全文
摘要:
流行病学研究常见的分析就是相关性分析了。 相关性分析某种程度上可以为我们提供一些研究思路,比如缺乏元素A与某种癌症相关,那么我们可以通过补充元素A来减少患癌率。这个结论的大前提是缺乏元素A会导致这种癌症,也就是说元素A和癌症有因果关系。 但实际上,元素A和癌症有相关性,不代表他们之间就有因果关系。也 阅读全文
摘要:
之前我写过一篇文章 "群体遗传分析分层校正,该选用多少个PCA?" ,里面提到可以通过EIGENSTRAT软件确定显著的主成分,后续就可以将显著的主成分加入协变量中。 这篇文章主要是讲如何通过EIGENSTRAT软件确定显著的主成分。 1下载安装EIGENSTRAT 1.1 下载 "下载地址" :h 阅读全文
摘要:
前段时间有位小可爱问我,为什么她的QQ图特别飘,如果你不理解怎样算飘,请看下图: " " 理想的QQ图应该是这样的: " " 我当时的第一反应是:1)群体分层造成的;2)表型分布有问题。因此让她检查一下数据的群体分层情况,如果没有问题就看一下表型分布。 这段时间有空了,我觉得有必要梳理一下这个飘逸的 阅读全文
摘要:
1. 申请时间 23andme的申请截止日期为每年的6月和12月;最近的一次截止日期是2019年6月12号; 23andme的委员会会在申请截止日期后的三个月后告知申请是否通过,即9月和次年3月就能得知申请结果; 2. 申请机构和申请人要求 申请机构可以是国内的、国外的、公共的、私人的,但必须是非商 阅读全文
摘要:
awk的功能特别强大,其中一个功能就是生成新的列,不论这列是在第一列,最后一列,还是中间,随你任性插入。 举例来说,有下列文件 a b c 1 2 3 现在我想在 的末尾新添一列,变成 a b c cwy 1 2 3 cwy 则可以用到命令 如果是在 的中间新添一列,变成 a b cwy c 1 2 阅读全文
摘要:
例子如下,存在test1.txt, test2.txt, test3.txt,现在准备把这三个文件的内容都追加到testall.txt 中 1 2 3 4 5 6 a b c e f g 59 9 6 z c b 则可以使用命令: , 生成如下文件: testall.txt 1 2 3 4 5 6 阅读全文