筛选染色体连续区域的策略

要求:筛选染色体上符合要求的连续的纯合突变区域。perl  (/(ㄒoㄒ)/~~现在只会用perl)

笨办法,正则匹配:

举例子1:

my $info=(HOMA,871334,HET,874950,HOMA,876499,HOMA,887643);

while($info =~ /((HOMA,(\d+),){2,})/g){
        print "$1\n"; ##$1是输出大括号内的内容,所有符合要求的具有连续连续至少两次纯合突变的区域被筛选出来啦
}

举例子2:

因为是按照染色体的位置顺序依次判断,预先设置一个变量来判断“区域中断点”,先设置为空,将读进去的区域第一个符合要求的变量赋给他,不同即为断点,判断之前存储的区域是否符合要求即可,然后从断点后继续筛选,将符合要求的纯合突变赋值给“断点”。。。

my @getpos=();##存储连续的homa位置信息
my $lasttype="";

foreach my $pos(@sortpos){##排好顺序的位置
          my $geno=$$hash{$chr}{$pos}{'geno'};
          if($geno ne $lasttype){
              if($lasttype eq ""){
                 if($geno eq 'HOMA'){
                  push @getpos,$pos;
                  $lasttype='HOMA';
                  next;
                 }
             }else{
                 check();##子函数检查模块
                 $lasttype="";
                 @getpos=();
             }
        }else{
            push @getpos,$pos;
            }
 }

 

 

bingo!!!

posted @ 2017-05-18 16:06  平果花  阅读(240)  评论(0编辑  收藏  举报