[Linux] 非root安装Lefse软件及其数据分析
说明
Lefse
软件是宏组学物种研究常用软件,一般大家用在线版本即可。但要搭建在Linux
集群环境中有点烦,记录一下折腾过程。
安装
这个软件是python2
写的,因此假设我已经安装好了较高版本的python2
以及pip
等工具,在此基础上来安装lefse
。
lefse
下载地址:https://bitbucket.org/nsegata/lefse/src/default/。这个网站有丰富的学习内容和教程,包括MetaPhIAn等流程,有时间去好好看看。
lefse
放在了bitbucket
上,克隆一下到集群:
hg clone https://bitbucket.org/nsegata/lefse
完成后有如下文件:
目录下有个requirement.txt
文件,里面列出了R
和Python
需要安装的包和模块:
- R
- R libraries: splines, stats4, survival, mvtnorm, modeltools, coin, MASS
- python libraries: rpy2 (v. 2.1 or higher), numpy, matplotlib (v. 1.0 or higher), argparse
安装R包的过程基本上没啥问题,大部分还是我已经安装过的。python
的大部分模块也没问题,难就难在了rpy2
。
首先,我直接用自己安装的python2
使用pip
安装:
pip intall rpy2
直接报语法错误,如下:
在网上找了一圈也没有碰到同类型的问题,在这里卡了很久,分析脚本貌似也没问题,而且如果这个都语法错误,作者去吃屎吧。后来我才知道这尼玛pip
自动安装第三版了,而第三版只支持python3
,不再支持python2
。
那就直接下载模块安装吧。自然地下了个较新的版本,解压后安装:
python setup.py install
直接报错,说是版本太高了,rpy
的第三版已经不支持python2
啦,blabla。。。我看它这里rpy2
版本也有较高要求,于是下载了个2.9
版本的(各旧版本
),结果还是太高,你特么不是python2
写的吗!不支持python2
。试了几次,干脆了个2016年发行的,这次终于可以了。
但是肯定没有这么简单,安装过程又报错了:
下载不了这个玩意:Download error on https://pypi.python.org/simple/singledispatch/
。网上有些答案乱七八糟,后来找到了一个能解决问题的,直接下载singledispatch
安装即可。
下载解压进入目录。
python setup.py install
成功安装singledispatch
后,再次安装rpy2
,这次没报错了。进入lefse
目录试运行一下:
应该是可以了。
再进去example
中运行下测试shell
,但是这个demo
是针对bioconda
使用的,如果没用conda
,测试不了。对于这个软件我真是服气的。
总之,lefse
软件算是安装成功了吧,至于测试,后续我再试试。
第二次更新:
接着来测试上次安装好的Lefse
软件,这个软件有现成的python
脚本进行数据处理和绘图,怎么用的话,在下载后example
中和官方文档中都有说明,这里不作说明了。简言之,就是先处理,整理好数据格式,进行绘图。
试着用自己的数据处理了下。
python format_input.py test.txt result.in -c 1 -s 2 -u 3 -o 1000000
python run_lefse.py result.in result.res
python plot_res.py result.res result.png
.......
文件结果没有问题,绘图及其后续步骤报错了:
我怀疑是自己处理的数据格式有问题,于是下载了官网的测试数据:
wget http://huttenhower.sph.harvard.edu/webfm_send/129 -O hmp_aerobiosis_small.txt
还是同样的问题,数据处理正常,绘图错误。网上查了下,没有直接相关的问题,但大致猜到是matplotlib
的问题。
我的系统除了我装的python
外,还有其他好几个python
版本的库,我当时只将其他版本的python
都注释了,然后将自己安装的python
及其库路径加入了环境变量,但没有注释掉其他python
版本的库。所以,我自己的python
其实是没有安装matplotlib
的,用的是其他版本的。
将其他版本python
的库注释后,用自己的python
重新安装matplotlib
(一定要注释掉其他的库,否则会提示已安装,是装不上matplotlib
的)。
这时,再运行lefse
时,没报错,所有结果都出来了!
看来当系统有多个版本时,用conda
确实是有优势的,避免版本冲突。
Ref:https://blog.csdn.net/chenKFKevin/article/details/77854232
http://blog.sciencenet.cn/blog-306699-997026.html
https://www.jianshu.com/p/b4dbd47aaeb6
本文来自博客园,作者:生物信息与育种,转载请注明原文链接:https://www.cnblogs.com/miyuanbiotech/p/11610045.html。若要及时了解动态信息,请关注同名微信公众号:生物信息与育种。