GeneMark安装及使用
http://topaz.gatech.edu/GeneMark/license_download.cgi
https://groups.google.com/g/maker-devel/c/P3rv1CzjkuU
https://cloud.tencent.com/developer/article/2075645
需要在官网注册后下载。官方的安装包中包含了密钥gm_key。
一、安装
wget http://topaz.gatech.edu/GeneMark/tmp/GMtool_k2xXm/gmes_linux_64_4.tar.gz
tar vxzf *.gz
cd gmes*
mv gm_key ~/.gm_key #密钥激活
perl gmes_petap.pl
#若发现缺少perl模块,缺啥装啥。直到成功运行上面的pl脚本
sudo cpanm YAML Hash::Merge Logger::Simple Parallel::ForkManager MCE::Mutex
二、训练模型
#使用GeneMarkET进行模型训练,只需要准备genome.fa
以及gene_models.gff3
两个文件即可开始。
#从gene_models.gff3文件中提取introns部分
awk '$3=="intron"' gene_models.gff3 > gene_models.introns.gff3
#Run the prediction
~/biosoft/genemarkes/gmes_petap.pl --sequence genome.fa --ET gene_models.introns.gff3 \
--training \
--cores 64 \
--v \
--max_intergenic 1000000 \
--max_intron 20000 > genemark.train.log 2>genemark.train.err
#生成的.mod文件就是我们需要的模型,可输入到maker中