使用snpflip校正基因组正负链

欢迎来到"bio生物信息"的世界

公众号有位小朋友留言希望我写一下snpflip的使用。

重新翻了一下之前写的推文，发现我是用意念写完的snpflip，总感觉我写过这个工具的使用了。

因此这里重新补充一下snpflip工具的使用。

关于snpflip的使用背景我就不多介绍了，之前的文章有写过数据合并，踩不完的坑

下面直接讲一下怎么使用。

这个工具安装和使用都非常简单，老少皆懂。

第一步：下载、安装snpflip

wget https://files.pythonhosted.org/packages/5d/58/c4e3427cd307c29c92631f0d2bc0ee599687d1d29019a390d9786ec6a44e/snpflip-0.0.6.tar.gz
tar -zxvf snpflip-0.0.6.tar.gz

第二步：下载参考基因组

wget http://ftp-trace.ncbi.nih.gov/1000genomes/ftp/technical/reference/human_g1k_v37.fasta.gz
gunzip human_g1k_v37.fasta.gz

第三步：校正正负链

查找混有正负链的SNP:

/snpflip-0.0.6/bin/snpflip -b file.bim -f human_g1k_v37.fasta -o snpflip_output

解释一下，file.bim就是混有正负链的plink文件。

human_g1k_v37.fasta就是第二步生成的参考基因组文件。

snpflip_output就是新生成的文件。

详细解释可看推文数据合并，踩不完的坑

统一正负链：

plink --file snp_data --flip snpflip_output.reverse --make-bed --out flipgood

snp_data是plink格式的文件

snpflip_output.reverse是上面找出来的负链。

如果你手头的数据不是plink格式的话，这里提供一个将vcf转化为plink文件的方法：plink --vcf yourfile.vcf --make-bed --out your_prefix

对了，使用这个软件可能会遇到报错：ImportError: /usr/lib64/libstdc++.so.6: version 'GLIBCXX_3.4.21' not found (required by ~/anaconda2/lib/python2.7/site-packages/pandas/_libs/window.so)

这个报错的解决方法就是找到满足'GLIBCXX_3.4.21'的libstdc++.so，然后将满足条件的libstdc++.so软连接到自己有权限的文件夹中。最后，export一下有权限的这个文件夹。当然，如果你有root权限的话，就直接软连接到报错的libstdc++.so.6路径中。网上这个报错的教程很多，请自行搜索。

最后，希望你们能顺利的跑完这个软件。

posted @ 2020-04-19 17:51 橙子牛奶糖阅读(1571) 评论(0) 编辑收藏举报

会员力量，点亮园子希望

刷新页面返回顶部

橙子牛奶糖

简介：陈文燕，本科暨南大学，中科院博士。欢迎关注微信公众号“bio生物信息”，进群与众多生信同行一起讨论学术问题。私信不回，有问题请在文章下面评论。

使用snpflip校正基因组正负链

第一步：下载、安装snpflip

第二步：下载参考基因组

第三步：校正正负链

公告

橙子牛奶糖

简介：陈文燕，本科暨南大学，中科院博士。 欢迎关注微信公众号“bio生物信息”，进群与众多生信同行一起讨论学术问题。私信不回，有问题请在文章下面评论。

使用snpflip校正基因组正负链

第一步：下载、安装snpflip

第二步：下载参考基因组

第三步：校正正负链

公告

简介：陈文燕，本科暨南大学，中科院博士。欢迎关注微信公众号“bio生物信息”，进群与众多生信同行一起讨论学术问题。私信不回，有问题请在文章下面评论。