摘要: 似然“似然”是对likelihood 的一种较为贴近文言文的翻译.“似然”用现代的中文来说即“可能性”。 似然函数设总体X服从分布P(x;θ)(当X是连续型随机变量时为概率密度,当X为离散型随机变量时为概率分布),θ为待估参数,X1,X2,…Xn是来自于总体 X的样本,x1,x2…xn为样本X1,X2,…Xn的一个观察值,则样本的联合分布(当X是连续型随机变量时为概率密度,当X为离散型随机变量时为概率分布) L(θ)=L(x1,x2,…,xn;θ)=ΠP(xi;θ)称为似然函数.最大似然估计我们可能不知道θ的值,尽管我们知道这些采样数据来自于分布D。那么我们如何才能估计出θ呢?一个自然的想法是 阅读全文
posted @ 2011-05-29 20:41 emanlee 阅读(3322) 评论(0) 推荐(0) 编辑
摘要: 定义 聚合酶链式反应,其英文Polymease Chain Reaction(PCR)是体外酶促合成特异DNA片段的一种方法,由高温变性、低温退火及适温延伸等几步反应组成一个周期,循环进行,使目的DNA得以迅速扩增,具有特异性强、灵敏度高、操作简便、省时等特点。它不仅可用于基因分离、克隆和核酸序列分析等基础研究,还可用于疾病的诊断或任何有DNA,RNA的地方.聚合酶链式反应又称无细胞分子克隆或特异性DNA序列体外引物定向酶促扩增技术。工作原理 类似于DNA的天然复制过程,其特异性依赖于与靶序列两端互补的寡核苷酸引物。PCR由变性--退火(复性)--延伸三个基本反应步骤构成:①模板DNA的变性: 阅读全文
posted @ 2011-05-29 20:23 emanlee 阅读(3116) 评论(0) 推荐(0) 编辑
摘要: 定义:某一物种的染色体图谱(也就是我们所知的连锁图谱),显示所知的基因和/或遗传标记的相对位置,而不是在每条染色体上特殊的物理位置。 如果同一条染色体上的两个基因相对距离越长,那么他们减数分裂发生重组的概率将越大,共同遗传的概率也就越小。因此可以根据他们后代性状的分离可以判断他们的交换率,也就可以判断他们在遗传图谱上的相对距离。通过遗传重组所得到的基因在具体染色体上线性排列图称为遗传连锁图。它是通过计算连锁的遗传标志之间的重组频率,确定他们的相对距离,一般用厘摩(cM,即每次减数分裂的重组频率为1%)来表示。绘制遗传连锁图的方法有很多,但是在DNA多态性技术未开发时,鉴定的连锁图很少,随着DN 阅读全文
posted @ 2011-05-29 20:22 emanlee 阅读(1563) 评论(0) 推荐(0) 编辑
摘要: DNA微阵列(DNA Microarray)也叫寡核苷酸阵列(Oligonucleitide array),是人类基因组计划(Human Geneome Project,HGP)的逐步实施和分子生物学的迅猛发展及运用的产物,它是生物学家受到计算机芯片制造和广为应用的启迪,融微电子学、生命科学、计算机科学和光电化学为一体,在原来核酸杂交(Northern、Southern)的基础上发展起来的一项新技术,它是第三次革命(基因组革命)中的主要技术之一,是生物芯片中的一种。该技术的原理是在固体表面上集成已知序列的基因探针,被测生物细胞或组织中大量标记的核酸序列与上述探针阵列进行杂交,通过检测相应位置杂 阅读全文
posted @ 2011-05-29 20:19 emanlee 阅读(5693) 评论(0) 推荐(0) 编辑
摘要: 微阵列数据广泛而成功地应用于生物医学的癌症分类研究.一个典型的微阵列数据集包含大量(通常成千上万 ,甚至数十万)的基因、 相对少量(往往不足一百)的样本.在这成千上万的基因中 ,仅仅一少部分基因对癌症分类有贡献.因而,对于癌症分类来说,最重要的一个问题就是识别出对癌症分类最有贡献的基因.这一识别过程称为基因选择.基因选择在统计模式识别、 机器学习和数据挖掘领域已得到广泛研究.基因微阵列数据通常包含大量与肿瘤分类无关的数据,会严重降低肿瘤诊断的准确率;基因微阵列数据还存在小样本、高维度的问题,也增加了肿瘤诊断的难度,所以必须对其进行基因选择。 阅读全文
posted @ 2011-05-29 20:18 emanlee 阅读(1112) 评论(0) 推荐(0) 编辑
摘要: LOD值 LOD score 定义:确定两个基因座是否在染色体上距离很近,因此可能一起遗传的统计学评估。三个或更多的LOD评价通常显示了两个基因座的位置很紧密。 详解:遗传学上通常用或然率的常用对数作为标准的衡量方法,该值的对数值称为Lod值或对数优势比:根据两个非此即彼的假设,计算数据的整体或然性,以确定两个基因座或是按一定的重组率而相互连锁的可能性或是互不连锁的可能性;这两种可能性之比,是基因座实际上为连锁的可能性;这个比率的10作底的对数就是对数优势比。为了确定两对基因之间是否存在连锁,一般要求或然比大于1000:1,即Lod>3;而要否定连锁存在,则要求或然小于100:1,即Lo 阅读全文
posted @ 2011-05-29 20:15 emanlee 阅读(6479) 评论(0) 推荐(0) 编辑
摘要: 什么是SSLP和ISSR?简单序列长度多态性(simple sequence length polymorphism,SSLP)是据串联重复排列微卫星基序两侧的单一序列设计引物,对微卫星序列(microsatellite DNA或simple sequence repeats,SSR)进行扩增,由微卫星基序重复数目的变异而产生多态性。由于基因组中某一特定的微卫星的侧翼序列通常都是保守性较强的单一序列,因而可以将微卫星侧翼的DNA片段克隆、测序,然后根据微卫星的侧翼序列就可以人工合成引物进行PCR扩增,从而将单个微卫星位点扩增出来。由于单个微卫星位点重复单元在数量上的变异,个体的扩增产物在长度上 阅读全文
posted @ 2011-05-29 20:12 emanlee 阅读(1133) 评论(0) 推荐(0) 编辑
摘要: ROC曲线的意义 ROC曲线指受试者工作特征曲线(receiver operating characteristic curve), 是反映敏感性和特异性连续变量的综合指标,是用构图法揭示敏感性和特异性的相互关系,它通过将连续变量设定出多个不同的临界值,从而计算出一系列敏感性和特异性,再以敏感性为纵 阅读全文
posted @ 2011-05-29 20:10 emanlee 阅读(10297) 评论(0) 推荐(0) 编辑
摘要: Acceptor splice site --- The boundary between the 3’ end of an intron and the 5’ end of the following exon. Also called 3’ splice site.剪接受体位点:内含子3′末端与下一个外显子5′端之间的交界处。又称3′剪接位点。Acrocentric --- A type of chromosome with the centromere near one end. The human acrocentric chromosomes (13, 14, 15, 21, and 阅读全文
posted @ 2011-05-29 19:48 emanlee 阅读(1705) 评论(0) 推荐(0) 编辑
摘要: Relative risk --- A comparison of the risk for a disease or trait in individuals who share a particular factor (such as genotype, an environmental exposure, or a drug) versus the risk among individuals who lack the factor. Affected Unaffected TotalFactor present a b a+bFactor absent c d c+dTotal a+c 阅读全文
posted @ 2011-05-29 19:47 emanlee 阅读(1475) 评论(0) 推荐(0) 编辑
摘要: Spectral karyotyping (SKY) --- A procedure that uses the fluorescence in situ hybridization (FISH) technique to stain each of the 24 human chromosomes distinctively.图谱核型分析(SKY):用荧光原位杂交(FISH)技术,对 24条人类染色体进行各自染色。Splicing --- The splicing out of introns and splicing together of exons in the generation 阅读全文
posted @ 2011-05-29 19:47 emanlee 阅读(1183) 评论(0) 推荐(0) 编辑
摘要: Pharmacodynamics --- The effects of a drug or its metabolites on physiological function and metabolic pathways.药效学:药物或其代谢物在生理功能和代谢途径中的作用Pharmacogenetics --- The area of biochemical genetics concerned with the impact of genetic variation on drug response and metabolism.药物遗传学:主要研究遗传因素对物种内不同个体的药物吸收、分布、 阅读全文
posted @ 2011-05-29 19:46 emanlee 阅读(1825) 评论(0) 推荐(0) 编辑
摘要: Microarray --- Miniaturized wafer (“chip”) made of glass, plastic, or silicon onto which a large number of different nucleic acids have been individually spotted. See also CGH, expression profile.微阵列:点阵分布有大量核苷酸的微小芯片。参见CGH,表达谱。Microdeletion --- A chromosomal deletion that is too small to be seen unde 阅读全文
posted @ 2011-05-29 19:44 emanlee 阅读(1692) 评论(0) 推荐(0) 编辑
摘要: Immunoglobulin gene superfamily --- A family of evolutionarily related genes composed of human leukocyte antigen (HLA) class I and class II genes, immunoglobulin genes, T-cell receptor genes, and other genes encoding cell surface molecules.免疫球蛋白基因超级家族:进化上同源的基因家族,包括HLA I类和II类基因、免疫球蛋白基因、T细胞受体基因以及其它编码细 阅读全文
posted @ 2011-05-29 19:43 emanlee 阅读(1805) 评论(0) 推荐(0) 编辑
摘要: Gene flow --- Gradual diffusion of genes from one population to another across a barrier. The barrier may be physical or cultural and may be breached by migration or mixing.基因流:由于合子或配子的散布,基因从某一群体扩散到其它群体,从而引起等位基因频率改变的现象。Gene map --- The characteristic arrangement of the genes on the chromosomes. 基因图: 阅读全文
posted @ 2011-05-29 19:42 emanlee 阅读(2355) 评论(0) 推荐(0) 编辑
摘要: Deformation syndrome --- A recognizable pattern of dysmorphic features caused by extrinsic factors that affect the fetus in utero.变形综合征:子宫中因外部因素影响胎儿而导致的一种畸形。Degeneracy of the code --- The genetic code is described as degenerate because most of the 20 amino acids are specified by more than 1 of the 6 阅读全文
posted @ 2011-05-29 19:41 emanlee 阅读(1713) 评论(0) 推荐(0) 编辑
摘要: CG (or CpG) island --- Any region of the genome containing an unusually high concentration of the dinucleotide sequence 5’-CG-3’. Often associated with promoters of genes, in particular housekeeping genes.CG(或CpG)岛:含双核苷酸序列5’-CG-3’较多的区域。通常与基因(尤其是持家基因)的启动子有关。CGH --- See comparative genome hybridizatio 阅读全文
posted @ 2011-05-29 19:40 emanlee 阅读(2047) 评论(0) 推荐(0) 编辑
摘要: 1、数学:高数(上册,下册)、线代、概率论、随机过程,离散数学;2、生物:普通生物学、生物化学、分子生物学、细胞生物学、遗传学、基因组学、蛋白组学等;3、计算机:计算机基础、C语言、C++、JAVA、Perl、数据结构、数据库、数据挖掘、计算机算法、软件工程。这是最基本的,根据方向还有其他很多要学习的。 阅读全文
posted @ 2011-05-29 19:28 emanlee 阅读(1322) 评论(0) 推荐(1) 编辑