2013年12月12日
摘要: 如果我想对一个每行70个字符的文本处理,让它生成每列10个字符,每行6列,并输出字符数怎么弄呀?如:TINHTFGNPVIPFKDGIYFAATEKSNVVRGWVFGSTMNNKSQSVIIINNSTNVVIRACNFELCDNPFFAVSKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSEKSGNFKHLREFVFKNKDGFLYVYKGYQPIDVVRDLP生成:1TINHTFGNPVIPFKDGIYFAATEKSNVVRGWVFGSTMNNKSQSVIIINNSTNVVIRACNF61ELCDNPFFAVSKPMGTQTHTMIFDNAFNCTFEYISDAFSLDVSE 阅读全文
posted @ 2013-12-12 18:09 三川 阅读(812) 评论(0) 推荐(0) 编辑
摘要: shell:1 [huangzhiwei@localhost huangzhiwei]$ cat test.sh2 #!/bin/sh3 lines=`wc -l4 num=$(($RANDOM % $lines))5 rnum=$(($num + 1))6 name=`sed -n "$rnum p" test.txt|cut -f1`7 xuehao=`sed -n "$rnum p" test.txt|cut -f2`8 echo "欢迎"$name"上台演讲,他的学号是:"$xuehao9 -------- 阅读全文
posted @ 2013-12-12 18:08 三川 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 输入:程序 K值 序列文件需求:1、对于给定序列文件,按照K值进行分割,分割成每K个字符一组。如:ATCGCGCGCG _K=1_A T C G C G C G C G (共10组字符)ATCGCGCGCG _K=2_AT CG CG CG CG(共5组字符)ATCGCGCGCG _K=3_ATC GCG CGC G(共4组字符)2、令A=0 T=1 G=2 C=3统计每组字符的数值(每组第一个字符系数为4的(K-1)次方)如:ATG 则为 0*4*4+1*4+2=6CG 则为 3*4+2=14输出:序列1 频数1 数值1序列2 频数2 数值2。。。(频数由大到小联系)如: ATCGCGCGC 阅读全文
posted @ 2013-12-12 18:07 三川 阅读(354) 评论(0) 推荐(0) 编辑
摘要: 1 ------------------------------------- 2 1、 3 #!/usr/bin/perl -w 4 $result=1; 5 $sum=0; 6 for($k=1;$k<=20;$k++){ 7 $result*=$k; 8 $sum+=$result; 9 }10 printf("%.0f\n",$sum);11 -----------------------------------------2、13 #!/usr/bin/perl14 use List::Util qw(reduce sum);15 printf (" 阅读全文
posted @ 2013-12-12 18:05 三川 阅读(955) 评论(0) 推荐(0) 编辑
摘要: 我有一个文本,如下:__________________________________________________NM_130786acgctcatgccgcctaattatgcccgcgtaacNM_014576tttatgatgacgtaaatgaatgatccatgaNM_001142333tcatggacaacagttagccatcaccccatagNM_033110atgctgtgaaggNM_033112ctgctgtgaagg_______________________________________________第一列我们称之为NM号,第二列是相应的序列字符串.如果我 阅读全文
posted @ 2013-12-12 18:04 三川 阅读(440) 评论(0) 推荐(0) 编辑
摘要: -----------------------------------------------------------处理数据:refseq1 813+NM_152486SAMD11refseq1 611+NM_152486SAMD11refseq1 1416+NM_152486SAMD11refseq1 612-NM_021170HES4refseq1 810-NM_021170HES4refseq2 911-NM_001002919FAM150Brefseq2 38-NM_001002919FAM150B------------------------------------------- 阅读全文
posted @ 2013-12-12 18:02 三川 阅读(1058) 评论(0) 推荐(0) 编辑
摘要: 我手头上有三个文件,他们的格式都是一样的,总共5列.如果我想求他们的并集,并且如果前三列相同第四列的数字相加,第五列信息合并.我尝试用多维哈希去做,可是结果并不齐全.应该怎么做呢?以下是文件格式:____________________________________________________________________________________1.505.txtWINGS 1000 4000 3 3/20_505WINGS 5000 6000 8 8/20_505SANLY 2000 4000 9 9/20_505TINAG 8000 10000 11 11/20_5052. 阅读全文
posted @ 2013-12-12 18:00 三川 阅读(450) 评论(0) 推荐(0) 编辑
摘要: 处理文本:M1179-1 function=deletion;1263M1179-1 function=insertion;872M3-S11function=deletion;1278M3-S11function=insertion;898M1159-1 function=deletion;878M1159-1 function=insertion;859我想按照第二列信息进行分类生成如下结果:functionM1179-1M3-S11 M1159-1deletion12631278878insertion872898859---------------------------------- 阅读全文
posted @ 2013-12-12 17:58 三川 阅读(408) 评论(0) 推荐(0) 编辑
摘要: 我想比较两个文件,它们的元素是不对等的,第二个文件中第二列($ling_2[1])和第一个文件的第二第三列为数字($ling_1[1]\$ling_1[2]),两个文件的第一列均为染色体编号,一个编号对应多组数字。我的需求是:我想找到第一个文件上和第二个文件的染色体编号相同,且第二个文件的数字是在第一个文件两个数字之间的,即$ling_1[1] result.txt" or die"$!";my $ref = {};while () { chomp; my @arr = split/\t/; $ref->{$arr[0]}->{$arr[1]}-> 阅读全文
posted @ 2013-12-12 17:56 三川 阅读(267) 评论(0) 推荐(0) 编辑