本地clump data

在使用TwoSampleMR分析样本的时候,时长遇到clump_data报错,原因是需要联网,其实可以在本地clump数据,使用ieugwasr包里面的ld_clump_data函数
,在安装TwoSampleMR的时候会自动安装ieugwasr包,如果需要最新的包,可以使用:
remotes::install_github("mrcieu/ieugwasr")
该函数说明如下:

关键参数:

dat是需要处理的snp信息,至少要有两列,一列必须叫rsid,内容是rs编号,另一列必须叫pval,内容是snp在GWAS中的p值。
clump_kb ,clump_r2,clump_p按需设置
bfile指的是参考基因组数据,参考链接https://ctg.cncr.nl/software/magma
plink_bin 指的是plink的可执行文件位置,如/usr/bin/plink,可以使用命令sudo apt install plink1.9下载1.9版本的,2.0版本的没有本地clump功能

本地clump关键代码:

expo_clump <- ieugwasr::ld_clump_local(dat = dat,
                         clump_r2 = 0.001,
                         clump_p = 1,
                         clump_kb = 10000,
                         plink_bin = "/usr/bin/plink1.9",
                         bfile = "/home/ref/g1000_eur/g1000_eur"  #该参数第二个g1000_eur指的是g1000_eur.bed等文件,前面哪个g1000_eur是文件夹
)

其实也可以:

plink1.9 --bfile /home/ref/g1000_eur/g1000_eur --clump dat --clump-kb 10000 --clump-p1 1 --clump-r2 0.001 --noweb --out /home/gwas/clump_data

posted on 2023-09-20 17:34  消失的森林  阅读(4349)  评论(0编辑  收藏  举报

导航