多序列比对
文章转载于
MSA 有许多用途,如构建系统发育树,选择压分析,基因家族的保守结构域分析,motif 分析等。
MSA 分析的软件有很多,如 mafft(http://mafft.cbrc.jp/alignment/software/),muscle(http://www.drive5.com/muscle/downloads.htm),probcons(http://probcons.stanford.edu/),T-coffee(http://tcoffee.crg.cat/),clustalw(http://clustalw.ddbj.nig.ac.jp/)等。
从软件的速度和准确性出发,mafft 和 muscle 是不错的选择。这里介绍 mafft 的使用方法。
mafft 安装(非 root)
-
下载
- wget http://mafft.cbrc.jp/alignment/software/mafft-7.310-with-extensions-src.tgz
- 解压
- tar -zxvf mafft-7.310-with-extensions-src.tgz
- 编辑 Makefile 文件的第一行
-
cd mafft-7.310-with-extensions/core/
vim Makefile (或用 nano 等进行编辑)
编辑:
PREFIX = /usr/local
为:
PREFIX = /home/your_home/somewhere
(如:PREFIX = /home/liuhui/bin/mafft-7.310
- 编译和安
-
make
make install
- 安装最后安装在
/home/liuhui/bin/mafft-7.310/bin
下,将这个路径放到.bashrc
中即可 -
mafft 使用方法
mafft 的一般用法为:
- mafft [arguments] input > output
-
input 可以是 fasta 格式的蛋白质或核苷酸序列。
对于 200 条序列以内且序列长度小于 2,000 bp 或 aa 的文件,可以使用
mafft-linsi
- mafft-linsi input > output
- 文件较小时,也可以使用在线版:http://mafft.cbrc.jp/alignment/server/
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步