great vision|be quite honest with you
摘要:won a national championship拿到全国冠军 come play for you参加你的队伍 Really not true事实并非如此 Being the Socratic professor that I am. 作为一个苏格拉底式的教授 great vision好视力 H
阅读全文
Hairpin|Bulge|Loop|假结|共变化(进化)|单序列预测|snRNA|snoRNA|siRNA|microRNA|piRNA|LncRNA|antisense RNAs|cis-NATs|trans-NATs|假基因|环形RNA
摘要:生物信息学 GU也可以配对,即“wobble” pairing GU。 Hairpin发夹结构,最少不能少于3个碱基。没有配对 Bulge 单侧配对 Loop双侧配对 假结,游离的leading edge与hairpin相结合。大部分软件不考虑此结构。 表示RNA5种结构: 如果有假结,则环形图会有
阅读全文
PSI-BLAST|PHI-BLAST|UniProt|IGV|Galaxy|clustalx
摘要:生物信息学软件: NCBI:BLAST,设定k-mer 默认是全局比对,Blastn是局部比对。 PSI-BLAST最灵敏的BLAST,选中部分矩阵后在数据库中查找相应蛋白。 PHI-BLAST找氨基酸motif ,参数有-db 数据库,-query 输入文件,-cut输出文件 Ensembl模式生
阅读全文
新技术
摘要:生物医学大数据-医学数据结合AI&自动化 Eg:Image net:识别眼科疾病
阅读全文
精准医疗
摘要:生物医疗大数据 PBMC-密度梯度离心 基因组找variants与药物使用相关, Eg:健康管理 Eg:婴幼儿检测 药物基因组学 Eg:神经递质 Eg:糖尿病 Eg:cancer 药物筛查 Cancer治疗方法:1.化疗2.基因靶向治疗3.免疫疗法 癌症精准医疗的几个方面:1.癌症筛查2.药物筛选(
阅读全文
生物信息学的研究过程
摘要:生物信息学的研究过程 数字化是指将生物信息提取为数据,并积累和整合。信息化是指经过数字化之后的数据放入算法模型当中进行计算和整合,智能化是指通过算法模型得到的信息之后,再经过信息挖掘能反馈出相应的应用信息并转化到应用层面。 生物信息三巨头: NCBI、EBI和BIG data center 国家生物
阅读全文
蛋白质结构预测
摘要:蛋白质结构预测: 结构预测方法:4种 同源建模:HM目标,基于序列的方法 蛋白质线程:FR目标,序列-结构比对 从头算折叠方法:NF目标,建立结构而不引用现有结构 一致性方法:对由多个预测程序生成的某些候选人的预测进行投票 相互作用预测3种 蛋白质-蛋白质相互作用是指涉及相同的代谢途径或生物过程,或
阅读全文
CP
摘要:关键期是指动物在发育过程中经历的一种神经可塑性变化时期,神经开始发育时可塑性较强,随着年龄和经验的增长可塑性逐步降低。 可以从五流的角度来证明关键期的存在。 从信息流来说,与唱歌感知有关的基因,对于幼年有唱歌训练的斑马雀来说,从幼年到成年的过程中该基因表达由高到低,即该基因表达与年龄有关,对于幼年没
阅读全文
基因组大小控制因素
摘要:简述影响多细胞生物基因组大小的各种因素,并尽力解释可能的原因和验证方案。 1.因素一:从操作流来说,剪切过程决定基因组大小。 1.1可能的解释:比如动物的剪切子比植物的更复杂也更为保守,其中动物剪切子上的增强子在exon中,而植物在intron中,所以动物剪切的内含子比植物多,即动物允许重复序列插入
阅读全文
RNA组研究困难
摘要:RNA组研究的困难何在?如果开发新技术来解决这些困难,您最想解决的科学问题是什么? RNA研究的困难在于研究技术落后 (1)从信息流来说,我们需要直接测定RNA的序列,但是我们只能DNA测序仪间接测得。 (2)从操作流来说,我们需要直接测定修饰核苷酸在序列中的位置,但是逆转录成cDNA后就失去了修饰
阅读全文
RNA分类|技术策略|终极目标
摘要:如何在转录水平分类所有RNA分子?可以罗列所有的可能性、技术策略和终极目标。 可能性:见纸 技术策略:RNA单细胞直测技术 终极目标:单细胞水平RNA直测技术决定新的人类RNA组和人类表观组学两个核心计划的启动 具体而言是建立细胞RNA组(实现免扩增和全部RNA的定量)、建立单细胞RNA组(逾两百种
阅读全文
动物基因组与植物基因组基本差异
摘要:植物vs动物总结版: 简述高等植物基因组(可以以拟南芥和水稻基因组为例)与高等动物基因组(可以以人类、果蝇等基因组为例)在基因结构层面展示出来的基本差异。 高等植物基因组与高等动物基因组在基因结构上的基本差异主要是生命组学的第一困境,即复制-转录负载困境。 机制: 1.从平衡流看, 1.1高等植物基
阅读全文
专利权
摘要:考点:专利权特征 1.专利权及其特征:时间性、专有性、地域性 专利权是国家根据发明人或设计人的申请,以向社会公开发明创造的内容,以及发明创造对社会具有符合法律规定的利益为前提,根据法定程序在一定期限内授予发明人或设计让的一种排他性权利。 1.1排他性更强 例:二人出于巧合先后各自独立创作出相同的作品
阅读全文
著作权
摘要:第一章 总则 1.1著作权的概念和特征 著作权是指文学、艺术和自然科学、社会科学、工程技术等作品的创作者对其作品所依法享 有的权利(民事权利)。狭义上的著作权仅指作者权(author’s right);广义的著作权包括邻接权(neighbouring right),邻接权是广义与狭义版权的区别。 1
阅读全文
知识产权概论
摘要:知识产权-知识产权概论 1.知识产权基本知识 1.1知识产权的概念 知识产权(Intellectual Property)是指自然人、法人或其他组织对自然人通过智力劳动所创造的智力成果,依法确认并享有的权利。 知识产权是民事主体依法对创造性智力成果和商业标记等享有的排他、支配的权利。我国首次使用“知
阅读全文
商标权
摘要:商标法 1.商标概念和分类 1.1商标概念 商业标记是指用于商业活动的特殊符号、记号、文字、图案等,包括商标、商号、原产地名称(商品特定区域,比如“云南白药”中的云南)、货源标记又称产地标志(商品统一性,比如“中国制造”中的制造)、地理标记(在TRIPS中指原产地名称)等。货源标记和原产地名称都是地
阅读全文
Ka/ Ks|同义替换的三种路径|kaks_Calculator|
摘要:生命组学 研究old gene 和 young gene CAI选择信号;CGmutation信号 Neutrality plot:CG3与GC1、GC2的关系:平:mutation;正相关:selection signal Ks Ka Ka/ Ks代表选择压力,Core gene Ka/ Ks比较
阅读全文
Necroptosis|Apoptosis|CTC|
摘要:大数据-外周血研究 Necroptosis与Apoptosis...区别:肿瘤导致和自身凋亡。 CTC,肿瘤细胞脱落进入外周血,CTC(循环肿瘤细胞,CirculatingTumorCell)是存在于外周血中的各类肿瘤细胞的统称,通过检测CTC来判断预后。可通过荧光检测single CTC和CTC
阅读全文
reference-based measure|Distribution-based measure|密码子使用偏向性
摘要:生命组学 密码子使用偏向性是指同义密码子使用频率不同。 影响因素:1.GC2.横向基因转移3.selection 转录偏好于多的tRNA。 同种氨基酸但有密码子使用偏向。 发现密码子偏性的方法: 参考序列方法reference-based measure CAI:从0到1,0就是偏向性最小,1就是偏
阅读全文
抽样调查
摘要:抽样调查 有限群推断 计算人口特征(人口普查) 估计人口特征(抽样调查) 普查与抽样调查 预算和时间 范围 精确性 可行性 抽样调查的步骤 人口是多少? 感兴趣的参数是什么? 抽样框架是什么? 是否需要样本量? 要多少钱? *实际绘制样品的元素的列表 基本抽样计划 简单随机采样(SRS) 分层抽样,
阅读全文
抽样调查总结
摘要:抽样调查总结 1.简单随机抽样:从人群中随机选择一个人口单元,直到达到一组样本量“n”。 在每个选择过程中,其余的人口单位被选中的机会均等。一组样本以相同的概率发生。 正确性 系统差异 准确性 抽样误差 分层抽样 分层抽样的优点 1.确保每个阶层(亚群体)都有很好的权重。 2.如果抽样分配得当,可能
阅读全文
非参数检验总结
摘要:非参数检验总结 假设分布和使用参数的统计测试称为参数测试,不假定分布或不使用参数的统计测试称为非参数测试。 非参数检验可适用于非正态分布的数据。 优势 适用于任何尺度,不要求总体数据满足正态分布。 容易计算 最初是在广泛使用计算机之前开发的 少作假设 不需要涉及总体参数 结果可能和参数程序一样精确。
阅读全文
非参数统计
摘要:非参数统计 统计中的参数是什么? 大多数统计检验(如一般的线性模型)都假定某种基本分布,如正态分布。 如果你知道正态分布的平均值和标准偏差,那么你就知道如何计算概率。 均值和标准差称为参数,所有的理论分布都有参数。 假设分布和使用参数的统计测试称为参数测试。 不假定分布或不使用参数的统计测试称为非参
阅读全文
最小二乘法
摘要:最小二乘法来估计参数,就是使得实际值与估计值的差距的平方最小。 β可以被已知的未知数计算得到是无偏估计的值。但是用最小二乘法可以得到最好的线性无偏估计量,因为变异比较小。所以这种方法就是最稳定的最通用的方法。 如果只有一个β1,也就是只有y与x1,则使用两样本t检验和回归分析是一样的。因为两样本t检
阅读全文
回归分析总结
摘要:回归分析总结 回归的目的是用因(x)与果(y)之间的关系,最后达到用因来预测果的目的,相关分析中所涉及的变量x和y都是随机变量;回归分析中,因变量y是随机变量,自变量x可以是随机变量,也可以是非随机的确定变量。 x是没有误差的固定变量,或其误差可以忽略,而y是随机变量,且有随机误差。 前提: 在回归
阅读全文
广义线性模型
摘要:广义线性模型 GLM是一般线性模型的扩展,它处顺序和分类因变量。 所有的组件都是共有的三个组件: 随机分量 系统分量 链接函数 随机分量 随机分量跟随响应Y的概率分布 例1. (Y1,Y2,。....YN)可能是正态的。在这种情况下,我们会说随机分量是正态分布。该成分导致了普通回归和方差分析。 例2
阅读全文
常见的分布
摘要:影响估计的两个值: 无偏,要透过好的实验设计 随机误差,统计中最看重的部分 如果是离散值,那么以二项分布为例,如果是连续值,那么以正态分布为例:
阅读全文
因子分析和PCA总结
摘要:因子分析和PCA 定义 因子分析就是数据降维工具。从一组相关变量中删除冗余或重复,把相关的变量放在一个因子中,实在不相关的因子有可能被删掉。用一组较小的“派生”变量表示相关变量,这个派生就是新的因子。形成彼此相对独立的因素,就是说新的因子彼此之间正交。 应用 筛选变量。 步骤 3.1计算所有变量的相
阅读全文
因子分析
摘要:有前提条件 样本量 各变量之间必须有相关性(被归纳在一个因子里强相关,因子间弱相关) 因子分析:对定量数据,不对定性数据 特征值大于1 自己设置几个因子 旋转后,就是调整能够解释的项的占比, 选择原则 1.贡献率0.5 2.大于1 3.可解释 纠缠不清:根据专业知识判断 张冠李戴:大部队与某一项关联
阅读全文
排序
摘要:排序 PCA主元件分析,主成分分析 FA因子分析 CA对应分析 主元件分析,主成分分析 主成分分析(PCA)是一种用于数据的压缩和分类的技术。其目的是通过查找新的变量集(样本)来降低数据集(样本)的维数,这些变量集比原始变量集小,但保留了大多数样本的信息。 我们所说的信息是指由原始变量之间的相关性给
阅读全文
聚类与判别总结
摘要:聚类与判别 方差分析使用类别自变量和连续数因变量,而判别分析连续自变量和类别因变量(即类标签) 启发式方法:K-mean和k-medoid算法 k-means:每个群集由群集的中心表示 K-medoid或PAM(围绕medoid的分区):每个集群由集群中的一个对象表示 K-Mean 就是在已知要分为
阅读全文
聚类分析和判别分析
摘要:13聚类分析和判别分析 聚类分析 什么是聚类分析? 聚类:数据对象的集合 在同一集群内彼此相似 与其他集群中的对象不同 聚集分析 将一组数据对象分组为群集,即为分组 聚类是无监督的分类:没有预定义的类。 典型应用 作为了解数据分布的独立工具。 作为其它算法的预处理步骤 什么是好的聚类? 良好的聚类方
阅读全文
数据转换总结
摘要:以下方法便于将因素转化为方差齐性的: 对数转换:方差与平均值的平方成正比(即标准差与平均值成正比) 平方根转换:方差与平均值成比例。 倒数变换:标准差与组均值的平方成正比。 平方转换:标准偏差随着组均值的增加而减小,并且/或者如果分布向左倾斜。 反正弦变换是在处理比例和百分比时帮助数据分析人员的转换
阅读全文
数据转换
摘要:数据转换 变换是数值尺度的变化。 变换是对正常、均质、线性和异常值的故障的补救。 数据的标度影响变换的效用。 ü如果标度是任意的,则转换更有效, 如果尺度是有意义的,那么解释的难度就会增加。 对数变换 因子效应是乘法而不是加法 方差与平均值的平方成正比(即标准差与平均值成正比) 对数变换实例 假设的
阅读全文
相关分析总结
摘要:相关总结: 在两个随机变量计算完相关系数之后,该系数还不能使用(只能说明两个变量呈何种相关关系,比如正相关或者负相关,x与y的变异有XX可由两者之间的线性关系来表示), 即不能用R代表相关系数,r必须经过显著性检验才行。r经显著性检验的结果呈不显著时,便推断两变数间不存在相关关系, 这时不能用r代表
阅读全文
感染|免疫|微生物组
摘要:感染、免疫和微生物组 最易细菌感染的是婴儿。 Evolution of resistence有三类:1.自身突变2.人类导致等。 Viral family,未找到的1000个中有一半都致病。 有的疫苗时间长(HPV)有的时间短(流感疫苗)。 以前这位点后根据位点找pathway。 Eg:现在根据位点
阅读全文
可塑性|Exosomes
摘要:五流解释 肿瘤发源于不同组织如果不从各种组织出发,则不能有正确的解决方法。 Hallmarks of cancer LncRNAs操作流 Exosomes ,它的基本故事是平衡流,但是具体内涵是操作流。 Warburg effect,与能量转化有关,在不同末端现象中的体现。 Replication或
阅读全文
单细胞测序|单细胞基因组|单细胞转录组|Gene editing|
摘要:单细胞测序 单细胞基因组学 测量理由是单细胞的时间空间特异性。 Gene expression&co-expression 比较正常cell与疾病cell,正常organ与疾病organ,看出偏差。 分离单细胞,破碎细胞,RNA逆转录,测量cDNA。 Eg:BAC扩增,可以实现bias很小的的gen
阅读全文
药物动力学|肿瘤药物基因组研究的策略|OMIM database|PharmGKB
摘要:生命组学 同义突变虽然不改变蛋白质种类,但是影响量,修饰的稳定性。 SNP vs mutation SNV单核苷酸变化,mutation,SNP是从群体角度思考的,约有1%,mutation比SNP还低。 Alleles and genotype 多种效应叠加比孟德尔遗传出现的概率高。 依据SNP将
阅读全文