22-有参转录组实战8-基因功能注释_GO_KEGG_swissprot_pfam_TFDB_iTAK

#进行功能注释时,我们只用到蛋白文件,就是上一期提取序列的文件“Ptri.protein.fa”。 #使用命令“grep -c ">" Ptri.protein.fa”统计下“>”的个数,发现有52400个。 #新建文件夹“swissprot” wget https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz#下载 gunzip -c uniprot_sprot.fasta.gz > uniprot_sprot.fasta#解压 conda install diamond#安装 diamond makedb --in uniprot_sprot.fasta --db uniprot_sprot.fasta#建索引 nohup diamond blastp -d uniprot_sprot.fasta -q Ptri.protein.fa --max-target-seqs 1 --outfmt 6 --evalue 1e-5 > blastp.out &#注释 #查看文件blatp.out,十二列解释看表头
#新建文件夹“pfam” wget http://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam34.0/Pfam-A.hmm.gz#下载 gunzip -c Pfam-A.hmm.gz > Pfam-A.hmm#解压 conda install hmmer#安装 hmmpress Pfam-A.hmm#构索引 nohup hmmscan --domtblout pfam.domtblout Pfam-A.hmm Ptri.protein.fa &#注释 #查看文件pfam.domtblout
#Plant TFDB网站预测转录因子http://planttfdb.gao-lab.org/prediction.php
#预测了3835个转录因子。自己下载整理。
#iTAK预测转录因子、调控因子、激酶http://itak.feilab.net/cgi-bin/itak/online_itak.cgi
#接着GO注释和KEGG注释。以下重点参考https://zhuanlan.zhihu.com/p/475588763教程。
#http://eggnog-mapper.embl.de/
#打开邮箱
#开始工作
#等约半小时,打开链接下载结果
#只要这一个
#使用TBtools的这个功能
#放入注释文件
#得到几个txt文件,后面的富集会用到。
#最后自己用excel整理下,可以得到基因的各种注释信息。
#赛博朋克边缘行者
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布:重大改进与新特性概览!
· .NET10 - 预览版1新功能体验(一)