22-有参转录组实战8-基因功能注释_GO_KEGG_swissprot_pfam_TFDB_iTAK

复制代码

#进行功能注释时，我们只用到蛋白文件，就是上一期提取序列的文件“Ptri.protein.fa”。
#使用命令“grep -c ">" Ptri.protein.fa”统计下“>”的个数，发现有52400个。
#新建文件夹“swissprot”
wget https://ftp.uniprot.org/pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz#下载
gunzip -c uniprot_sprot.fasta.gz > uniprot_sprot.fasta#解压
conda install diamond#安装
diamond makedb --in uniprot_sprot.fasta --db uniprot_sprot.fasta#建索引
nohup diamond blastp -d uniprot_sprot.fasta -q Ptri.protein.fa --max-target-seqs 1 --outfmt 6 --evalue 1e-5 > blastp.out &#注释
#查看文件blatp.out，十二列解释看表头

复制代码

#新建文件夹“pfam”
wget http://ftp.ebi.ac.uk/pub/databases/Pfam/releases/Pfam34.0/Pfam-A.hmm.gz#下载
gunzip -c Pfam-A.hmm.gz > Pfam-A.hmm#解压
conda install hmmer#安装
hmmpress Pfam-A.hmm#构索引
nohup hmmscan --domtblout pfam.domtblout Pfam-A.hmm Ptri.protein.fa &#注释
#查看文件pfam.domtblout

#Plant TFDB网站预测转录因子http://planttfdb.gao-lab.org/prediction.php

#预测了3835个转录因子。自己下载整理。

#iTAK预测转录因子、调控因子、激酶http://itak.feilab.net/cgi-bin/itak/online_itak.cgi

#接着GO注释和KEGG注释。以下重点参考https://zhuanlan.zhihu.com/p/475588763教程。

#http://eggnog-mapper.embl.de/

#打开邮箱

#开始工作

#等约半小时，打开链接下载结果

#只要这一个

#使用TBtools的这个功能

#放入注释文件

#得到几个txt文件，后面的富集会用到。

#最后自己用excel整理下，可以得到基因的各种注释信息。

#赛博朋克边缘行者

posted @ 2024-01-24 14:53 啊辉的科研阅读(66) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包，你的智能百科全书，全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

相关博文：

· 24-有参转录组实战10-差异基因KEGG富集分析

· 17-有参转录组实战3-计算readcount和TPM表达量

· 8. 参考基因组

· 9. seqtk seqkit gtftk 总结

· 08 Eggnog功能注释

阅读排行：
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· 物流快递公司核心技术能力-地址解析分单基础技术分享
· .NET 10首个预览版发布：重大改进与新特性概览！
· .NET10 - 预览版1新功能体验（一）

公告

昵称：啊辉的科研
园龄： 1年3个月
粉丝： 1
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔档案

阅读排行榜

AI FOR CODE 大赛