perl 多fasta文件匹配,并提取匹配文件第一条序列

目标如题,有多个fasta文件和一个文件名列表,将文件名列表中包含的文件匹配出来并提取第一条序列合并成一个fa文件。

这个采用perl实现,用法和代码如下:

image

复制代码
  1 #!/usr/bin/perl -w
  2 use strict;
  3 
  4 sub usage{
  5 	die "usage:perl $0 <fa.list> <Fasta_Dir> <merged.fa>\n",unless(@ARGV==3);
  6 }
  7 usage();
  8 
  9 open LIST,"$ARGV[0]";
 10 open F,"$ARGV[1]";
 11 open OU,">$ARGV[2]";
 12 
 13 my @listName=<LIST>;
 14 
 15 my @files=glob("$ARGV[1]/*.faa");
 16 my $matchNum=0;
 17 
 18 foreach my $k(@files){
 19 	my $fileName=(split /\//,$k)[-1];
 20 	if(grep /^$fileName$/,@listName){
 21 		$matchNum+=1;
 22 		open EACH,"$ARGV[1]/$fileName";
 23 		$/=">";
 24 		<EACH>;
 25 		while(<EACH>){
 26 			chomp;
 27 			my @info=split /\n/,$_;
 28 			my $seqID=shift @info;
 29 			my $seq=join "",@info;
 30 			print OU ">$seqID\n$seq\n";
 31 			last;
 32 		}
 33 		$/="\n";
 34 	}
 35 }
 36 
 37 print "match: $matchNum files,and merge completed!\n";
 38 
 39 close LIST;
 40 close F;
复制代码
posted @   天使不设防  阅读(765)  评论(0编辑  收藏  举报
编辑推荐:
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!
点击右上角即可分享
微信分享提示