perl 多fasta文件匹配,并提取匹配文件第一条序列
目标如题,有多个fasta文件和一个文件名列表,将文件名列表中包含的文件匹配出来并提取第一条序列合并成一个fa文件。
这个采用perl实现,用法和代码如下:
1 #!/usr/bin/perl -w 2 use strict; 3 4 sub usage{ 5 die "usage:perl $0 <fa.list> <Fasta_Dir> <merged.fa>\n",unless(@ARGV==3); 6 } 7 usage(); 8 9 open LIST,"$ARGV[0]"; 10 open F,"$ARGV[1]"; 11 open OU,">$ARGV[2]"; 12 13 my @listName=<LIST>; 14 15 my @files=glob("$ARGV[1]/*.faa"); 16 my $matchNum=0; 17 18 foreach my $k(@files){ 19 my $fileName=(split /\//,$k)[-1]; 20 if(grep /^$fileName$/,@listName){ 21 $matchNum+=1; 22 open EACH,"$ARGV[1]/$fileName"; 23 $/=">"; 24 <EACH>; 25 while(<EACH>){ 26 chomp; 27 my @info=split /\n/,$_; 28 my $seqID=shift @info; 29 my $seq=join "",@info; 30 print OU ">$seqID\n$seq\n"; 31 last; 32 } 33 $/="\n"; 34 } 35 } 36 37 print "match: $matchNum files,and merge completed!\n"; 38 39 close LIST; 40 close F;
作者:天使不设防
本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· SQL Server 2025 AI相关能力初探
· Linux系列:如何用 C#调用 C方法造成内存泄露
· AI与.NET技术实操系列(二):开始使用ML.NET
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
· 展开说说关于C#中ORM框架的用法!