blast软件比对库nr、nt库的下载、构建索引、序列比对

 

001、

 

002、

 

003、

 

004、

 

005、

 

006、

 

007、

链接:https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/

 。

nt为核酸数据库,nr为蛋白质数据库 

 

 

008、使用命令行下载

a、

[root@PC1 test02]# wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz
[root@PC1 test02]# wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nt.gz

 

b、解压

[root@PC1 test02]# gunzip nr.gz
[root@PC1 test02]# gunzip nt.gz

 

c、创建nr/nt数据库目录

[root@PC1 test02]# mkdir nr_db nt_db

 

d、构建nr/nt数据库

[root@PC1 test02]# makeblastdb -in nr -dbtype prot -title my_nr -parse_seqids -out ./nr_db/nr -logfile make_nr.log
[root@PC1 test02]# makeblastdb -in nt -dbtype nucl -title my_nt -parse_seqids -out ./nt_db/nt -logfile make_nt.log

 

 008、测试fastq文件的下载(用于生成进行比对的fasta格式数据)

wget -c https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos2/sra-pub-zq-18/ERR007/7959/ERR7959948/ERR7959948.lite.1
fastq-dump --split-files ERR7959948.lite.1

 

009、生成进行比对的测试的fasta格式数据

cat ERR7959948.lite.1_1.fastq | head -n 20000 | awk '{if(NR%4==1){print ">"$1}else if(NR%4==2){print $0}}'|sed 's/@//g' > myfile.fa

 

 

010、

 

 

 

参考:

001、https://www.jianshu.com/p/c4b6723fd786

002、https://blog.csdn.net/qq_42962326/article/details/105081327

003、

 

posted @ 2023-07-15 16:52  小鲨鱼2018  阅读(1233)  评论(0编辑  收藏  举报