index|substr
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 6 $_ = 'duwanxkm,c.,df;oq123@#!@%$#^'; 7 my $d ='d';my $o = 'o';my $where =index($_,$o);print "$where\n"; 8 $where =index($_,$d,7);print ...
阅读全文
关于目录的操作|*|<>|opendir |readdir|unlink|find2perl|rename|readlink|oct()|utime
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 6 foreach my $arg(@ARGV) 7 { 8 print "one is $arg\n"; 9 } 10 11 # perl t.pl *.txt 12 # one is 1.txt 13 # one is 2.txt 14 15 my @al...
阅读全文
文件操作符|-e|-M|-s|-A|_|-r -w $filename|stat|localtime|&|>>|<<
摘要:TTY:终端是一种字符型设备,它有多种类型,通常使用tty 来简称各种类型的终端设备
阅读全文
unless|until|LABEL|{}|last|next|redo| || |//|i++|++i
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 6 $_ = 'oireqo````'; 7 8 unless($_ =~ /^a/m){print "no match to a\n"} 9 10 #no match to a 11 12 if(!($_ =~ /^a/m)){print ...
阅读全文
计算蛋白质一致率
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 6 my $input = $ARGV[0];my $name = $ARGV[1];my $start = $ARGV[2];my $cut_start=$ARGV[3];my $cut_end=$ARGV[4]; 7 8 my $all_start=$ARGV[5]...
阅读全文
字符串与数字之间的转换
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 6 my $number = 1;$number =~/(\w*)/;print "$1"; 7 $number++;print "$number\n";
阅读全文
adaptation|domestication|genome evolution|convergent evolution|whole-genome shotgun sequencing|IHGSC
摘要:Dissecting evolution and disease using comparative vertebrate genomics-online 因为基因组不是独一无二的,同时人类基因组可以组为参考数据,所以最近这些年涌现了脊椎动物的基因数据,所以我们可以利用比较基因组学获得生物学各方面的
阅读全文
chromosome interaction mapping|cis- and trans-regulation|de novo|SRS|LRS|Haplotype blocks|linkage disequilibrium
摘要:Dissecting evolution and disease using comparative vertebrate genomics-The sequencing revolution short-read sequencing (SRS) (因大规模基因组数据需要,采用Illumina p
阅读全文
gff文件提取cds
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 ########input######## 6 7 my $gff = $ARGV[0];my $cut = &cut($gff);my %cut = %$cut; 8 9 my ($gene_number,$gene_id,$gene_name) = ($ARGV[...
阅读全文
MRCA|Wright–Fisher population genetic model|SNP rate
摘要:(Panda has a high heterozygosity rate) 通过对mtDNA(为了预测SNP的密度)的分析,可知panda的多样性,当前全基因组数据才能完全建立模型。 mitochondrial control region DNA:卫星DNA:微衛星(英语:Microsatell
阅读全文
Ab initio methods|Evidence-based methods|maximum-likelihood|branch-site|H1|H0|GO|dS/dN ratio
摘要:(Gene prediction and comparison) 使用基于基因组序列的从头预测方法(Ab initio methods)(同时分别使用头预测软件( GENSCAN和 AUGUSTUS)和预测exon和intron的剪切位点。)和基于证据支持的基因预测(Evidence-based m
阅读全文
perl -p -i -w -e
摘要:1 cat 1.txt 2 11111111111111111111111111111111111 3 kllk 4 nciuwbufcbew``````//.]];s[[..; 5 klklkl 6 7 x,dsncdk,;l,ex 8 xw,eocxmcmck 9 11111111111111111111111111111111111 10 11 perl -p -i....
阅读全文
s///|s()()i|/i|/g|\U|\u|\L|\l|\U\l|split|join|匹配到hash|匹配到变量|`date`|$^I
摘要:问题: 1 cat 1.txt |perl test.pl 后并无备份文件1.txt.bak?
阅读全文
/^/m|/$/m|\b|\B|$&|$`|$'|变量捕获|()?|(?:pattern)|(?<LABEL>PATTERN)|$+{LABEL}|(|)|\g{LABEL}
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 6 $_=' 7 8 $$ oinn &&& 9 ninq kdownc 10 aninp 11 kkkk'; 12 13 if (/(.*)k\Z/){print "$1\n";}else{print "no match\n";} 14 ...
阅读全文
$|^|\z|\Z|/a|/l
摘要:1 #!/usr/bin/perl 2 3 use strict; 4 use warnings; 5 6 foreach() 7 { 8 if (/(\w*)/a){print "$1\n";}else{print "no match\n";} 9 } 10 11 #11111111111111111111111111111111111 12 #nciuwbuf...
阅读全文
eubacteria|endosymbiosis|基因转移
摘要:5.11线粒体和叶绿体是通过内共生进化而来的 初始细胞俘获有功能的真细菌(eubacteria)进入细胞内,该细菌逐渐演化为细胞器,这种现象称为内共生(endosymbiosis),所以该细胞器携带细菌的所有基因。依据基因序列比对,可知线粒体与叶绿体来源于不同世系(lineage)的不同真细菌。因为
阅读全文
ctDNA|endosymbiosis
摘要:5.10叶绿体基因组编码多种蛋白质和RNA 叶绿体和线粒体的共同点:叶绿体和线粒体的大小,功能(编码区)大体一致,但叶绿体拥有更多基因,所以在编码tRNA时,也有内含子作为被剪切片段。 因为在原核生物仅拥有非断裂基因的时候,那时候没有叶绿体,此时发生共生事件(endosymbiosis),即一个有叶
阅读全文
mtDNA|ctDNA|cpDNA|
摘要:5.9细胞器基因组是编码细胞器蛋白质的环状DNA分子 细胞器中除真核细胞线粒体DNA(mtDNA)是线性的外,都是环状分子,比如叶绿体DNA(ctDNA,cpDNA)。因为单个细胞器有几套不同拷贝的细胞器基因组,同一个细胞内有许多不同细胞器。所以,细胞器基因组可以认为是重复序列。 叶绿体基因组大,线
阅读全文
extranuclear gene|non-Mendelian inheritance|uniparental inheritance|maternal inheritance
摘要:5.8某些细胞器含有DNA 因为除细胞核内的染色体外,细胞质中的细胞器上也有遗传物质(这类遗传物质被称为核外基因(extranuclear gene),比如线粒体上的rRNA,这是因为细胞器基因组是独立于细胞核内遗传物质进行遗传的,拥有自身的一套规则,有如下区别:无论细胞器上的遗传物质是杂合(有来自
阅读全文
pseudogene|鉴定功能基因|expressed se|quence tag
摘要:基因 (鉴定DNA:可以直接利用DNA序列鉴别基因,但存在3个问题) 1.intron太长(使用用来连接的算法不可及) 2.因为通常功能基因的第一个oxen中有非编码区和启动子最后一个oxen中有终止子和非编码区,但是有些功能基因的第一个oxen或最后一个oxen只有非编码区,这样就很难识别 3.假
阅读全文
|chromosomal walk |zoo blot|鉴定疾病gene|
摘要:5.6基于外显子的保守性鉴定真核生物编码蛋白质的基因 鉴定功能性基因的流程是:1.连锁分析找到该基因的染色体的特定区域;2.在这段序列中选择一条短序列,寻找满足两个条件的基因(条件一:因为功能性基因是可以编码出蛋白质的基因,所以它必须有可读框;条件二:因为功能性基因是保守的,所以它必须是种间同源的。
阅读全文
nonrepetitive DNA|repetitive DNA|moderaly repetitive DNA|highly repetitive DNA|selfish gene|junk DNA
摘要:5.5 真核生物基因组包含非重复DNA序列和重复DNA序列 依据重复序列的频数,可将真核生物DNA做如下分类: 1次即非重复DNA(nonrepetitive DNA,相应的也会更长,随着基因组扩大(进化?),会变得更加长,因为序列长代表着它的稳定性好,所以该种DNA作为编码mRNA的序列,所以外显
阅读全文
DNA fingerprinting|haplotpe|frequency of polymorphism|限制性标记的多态性
摘要:5.4利用RFLP和SNP绘制遗传图 因为限制性标记可以确定那个分子水平上的突变(即已知基因座),但是无法和蛋白质功能相联系。所以我们采用限制性标记的多态性,即该限制酶识别的位点若发生突变,则大概率在该基因座附近,所以可以将这些位点和表型相联系。所以可以据此判断遗传病的突变位点(因为突变在靶基因附近
阅读全文
SNP|RELP|genetic polymorphism|
摘要:5.3个体基因组呈现广泛变化 遗传多态性:一个基因座上存在多个等位基因(因为野生型不止一种基因)的现象,但是只有这多种等位基因满足:1.多个基因稳定存在2.基因在种群中数目大于1%时,认为该基因座多态,否则只认为该位置多态,不能够作为基因座(太少了,不具有研究意义)。 对于突变型来说,因为了比较不同
阅读全文
Repbase library|divergence rate|self-sequence alignment|genomic rearrangement|cutoffs|breakpoint
摘要:(Panda, dog and human repeat comparison):与其他动物比较重复序列 我们使用Repbase 库(重复序列库)+已知的转录原件序列+识别软件,评估出转录原件占比,并且与狗和人相比。用Repbase数据库(扩张度来自repeat base)分析熊猫基因中的转录原件的
阅读全文
【转载】K-mer算法
摘要:k-mer是指将reads分成包含k个碱基的字符串,一般长短为m的reads可以分成m-k+1个k-mers.举个例子吧,为了简化,有这么个reads(当然实际比这个长):AACTGACTGA.如果k-mer的k为3的话,我们可以将其切割为AAC ACT CTG TGA GAC ACT CTG TG
阅读全文
Evaluate|GC content|Phred|BAC|heterozygous single nucleotide polymorphisms|estimate genome size|
摘要:(Evaluate):检查reads,可使用比对软件:使用SOAPaligner重新排列;采用massively parallel next-generation sequencing technology,效果很好(因为覆盖率高,精度高) 重新做有何意义:此时不需要过高的测序深度,因为用原来的re
阅读全文
insert size|single-read|Paired-end|Mate-pair
摘要:(测序方面):测三只大熊猫;得到的insert size有150bp,500bp,2kb,5kb和10kb这四种,可测得序列长度和平均reads长度。 为什么average reads这么短? 因为insert size是打断前的长度,打断之后便是reads,这里计算average reads长度。
阅读全文
assembly|reads to contig|contig to scaffold|coverage|depth| tandem repeats
摘要:(组装方面):SOAPdenovo ,因为采用de Bruijn graph algorithm算法和stepwise strategy ,所以排错能力高,所以我们获得高质量数据。 de Bruijn graph algorithm算法???? reads到contig :多个reads比对,比对后
阅读全文
Needleman_Wunsch
摘要:Needleman_Wunsch算法思路:1.建立二维数组2.建立评分模式load1:向右;-2load2:向下;-2load3:对角线;依据是否配得到匹配:+1不匹配:-13...
阅读全文
自定义分隔符|/i|/x|/xs|需要转译
摘要:1 小骆驼 第八章 用正则表达式进行匹配 2 3 #!/usr/bin/envperl 4 5 use strict; 6 use warnings; 7 8 $_ ="#adchbehnyhme3534f\nvdh5ejbnv _+IHG\n"; 9 10 if(m%(a)%){print "$1\n";}else{print "no m...
阅读全文
grep取缩写|awk两个文件取交集
摘要:#!/bin/shles species_latinName_abbr.txt|grep -E 'Aptenodytes|Gavia|Phoenicopterus|Chlamy...
阅读全文
\p{space}|\p{Hex}|\p{Digit}|转译符|\1|\g{-1}|[^ab]|/([^\d\D]+)/
摘要:小骆驼 第七章 漫游正则表达式王国#!/usr/bin/perluse strict;use warnings;$_ = 'ab \ cde f ghijk10.x12ln'...
阅读全文
小骆驼 第六章 哈希
摘要:#!/usr/bin/perluse strict;use warnings;my %fruit;$fruit{'ap'.'ple'} = 1;$fruit{'banana'}...
阅读全文
小骆驼 第五章 输入与输出
摘要:输入文件句柄#!/usr/bin/perluse strict;use warnings;# cat 1.txt# ssssssssssss# ssssssssss# dddd...
阅读全文
小骆驼 第五章 输入与输出
摘要:输出到标准输出ssssssssssssssssssssssdddddddddddd2222222222sssssssssssssssss#!/usr/bin/perluse s...
阅读全文
小骆驼 第五章 输入与输出
摘要:读取标准输入#!/usr/bin/perluse strict;use warnings;my $line=;my $err = defined($line);print "$...
阅读全文
小骆驼 第四章 子程序
摘要:#!/usr/bin/perluse strict;use warnings;use 5.010;&print_hello;sub print_hello{ my $he...
阅读全文
check.pl
摘要:比对两个文件并纠错#!/usr/bin/perluse strict;use warnings;########################################...
阅读全文
小骆驼 第三章 列表与数组
摘要:环境上下文#!/usr/bin/envperluse strict;use warnings;$_ = "ABCDEFG";print;print"\n";##ABCDEFG$...
阅读全文
小骆驼 第三章 列表与数组
摘要:数组到foreach#!/usr/bin/envperluse strict;use warnings;foreach (qw( a b c )) { print "$_";...
阅读全文
小骆驼 第三章 列表与数组
摘要:列表#!/usr/bin/envperluse strict;use warnings;if( ( 1 , 2 , 3 ) eq ( 1 , 2 , 3 , ) ) {prin...
阅读全文
小骆驼 第三章 列表与数组
摘要:数组#!/usr/bin/envperluse strict;use warnings;my @arr; $arr[2] ="apple" ;print "$arr[3.14-...
阅读全文
小骆驼 第二章 标量数据
摘要:控制结构#!/usr/bin/envperluse strict;use warnings;my $word = chr (0x05D0);print "$word\n";my...
阅读全文
小骆驼 第二章 标量数据
摘要:$val部分#!/usr/bin/envperluse strict;use warnings;my $number = 3;$number **= 3;print "$num...
阅读全文
小骆驼 第二章 标量数据
摘要:数字与字符串#!/usr/bin/envperluse strict;use warnings;##加斜表示同一个数字my $number = 124567890;my $ne...
阅读全文
split和join合写
摘要:小骆驼 第一章 简介 1. 尝试去写与上面print相同功能的代码段,失败了,不知道怎么修改
阅读全文