Espritz安装使用


Espritz web地址



Espritz安装失败 

下载好Espritz ,输入example时报如下错误!
好吧,人家需要的是'GLIBC_2.14',先查看一下当前系统glibc的情况: 
  1. [ssw@mu01 build]$ strings /lib64/libc.so.6 |grep GLIBC
  2. GLIBC_2.2.5
  3. GLIBC_2.2.6
  4. GLIBC_2.3
  5. GLIBC_2.3.2
  6. GLIBC_2.3.3
  7. GLIBC_2.3.4
  8. GLIBC_2.4
  9. GLIBC_2.5
  10. GLIBC_PRIVATE
好吧,确实没有,安装一下。

1. glibc下载

从http://www.gnu.org/software/libc/ 下载源代码。我下载的版本是2.14,

2. 安装

因为glibc库使用广泛,为了避免污染当前系统环境,最好自定义安装目录,使用时定义一下环境变量就行了。具体步骤如下:
  1. [ssw@mu01 ~]$ wget http://ftp.gnu.org/gnu/glibc/glibc-2.14.tar.gz
  2. [ssw@mu01 ~]$ tar xvf glibc-2.14.tar.gz
  3. [ssw@mu01 ~]$ cd glibc-2.14
  4. [ssw@mu01 glibc-2.14]$ mkdir build
  5. [ssw@mu01 glibc-2.14]$ cd ./build
  6. [ssw@mu01 build]$ ../configure --prefix=/home/ssw/bin/glibc-2.14
  7. [ssw@mu01 build]$ make -j4
  8. [ssw@mu01 build]$ make install
当我们执行
  1. [ssw@mu01 build]$ ../configure --prefix=/home/ssw/bin/glibc-2.14
报如下错误。
 GLIBC_2.14版本以上的基本上都试了一遍,都报以上错误。目前最新版本的是GLIBC_2.24
能安装成功的只有GLIBC_2.10,但是安装GLIBC_2.10没用,软件依赖的至少是GLIBC_2.14的。 

使用web端

填入E-Mail然后上传fasta序列等候邮件即可,而且web端并没有限制序列的数量。
 
使用网页得到结果。
 

获得数据

等一段时间,我们会收到一封邮件如下。

 
打开连接我们可以获得6721个蛋白的disorder的5个特征。如下图。

 

计算我们自己数据的disorder

准备文件
yeast_gold_protein_pair.csv
 
disorder.csv
 
 代码如下:
  1. # -*- coding: utf-8 -*-
  2. """
  3. Created on Wed Nov 16 12:46:27 2016
  4. @author: sun
  5. """
  6. import pandas as pd
  7. yeast_gold_protein_pair=pd.read_csv('yeast_gold_protein_pair.csv',usecols=['idA','idB'])
  8. disorder=pd.read_csv('disorder.csv',index_col=0)
  9. #注loc通过标签选择数据,iloc通过位置选择数据
  10. idA=disorder.loc['sp' + yeast_gold_protein_pair.idA,:]
  11. idB=disorder.loc['sp' + yeast_gold_protein_pair.idB,:]
  12. idA.index=range(len(idA))
  13. idB.index=range(len(idB))
  14. data=pd.concat([yeast_gold_protein_pair,idA,idB],axis=1)
  15. data.to_csv('gold_protein_disorder.csv',index=False)
gold_protein_disorder.csv


 




posted @ 2016-11-16 12:33  春暖夏微凉。  阅读(622)  评论(0编辑  收藏  举报