08 2020 档案

摘要:1.理解朴素贝叶斯 1)基本概念 依据概率原则进行分类。如天气预测概率。 朴素贝叶斯(Naive Bayes, NB)适合场景:为估计一个结果的概率,从众多属性中提取的信息应该被同时考虑。 很多算法忽略了弱影响的特征(若有大量弱影响的特征,它们组合在一起的影响可能会很大),但NB算法利用了所有可以获 阅读全文
posted @ 2020-08-31 22:37 生物信息与育种 阅读(1906) 评论(0) 推荐(0) 编辑
摘要:1.理解使用KNN进行分类 KNN特点 近邻分类器:一种懒惰学习器,即把未标记的案例归类为与它们最相似的带有标记的案例所在的类。当一个概念很难定义,但你看到它时知道它是什么,就适合用KNN分类。 KNN优点:简单有效;数据分布无要求;训练快 KNN缺点:不产生模型(发现特征间关系能力有限);分类慢; 阅读全文
posted @ 2020-08-30 20:36 生物信息与育种 阅读(1803) 评论(0) 推荐(1) 编辑
摘要:1.基本概念 机器学习:发明算法将数据转化为智能行为 数据挖掘 VS 机器学习:前者侧重寻找有价值的信息,后者侧重执行已知的任务。后者是前者的先期准备 过程:数据——>抽象化——>一般化。或者:收集数据——推理数据——归纳数据——发现规律 抽象化: 训练:用一个特定模型来拟合数据集的过程 用方程来拟 阅读全文
posted @ 2020-08-29 15:49 生物信息与育种 阅读(1806) 评论(0) 推荐(2) 编辑
摘要:2015年的综述文章,marker一下,供以后比较试用。蛋白质基因组学研究中的质谱仪与生物信息学方法。 针对蛋白质基因组学的分析研究,总结了质谱仪和蛋白质基因组学流程分析软件的选择,重点评述了常用的生物信息学计算工具,如PepLine 、Proteogenomic Mapping Tool InsP 阅读全文
posted @ 2020-08-28 23:58 生物信息与育种 阅读(386) 评论(0) 推荐(0) 编辑
摘要:1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件(MQ),并发表在nbt上,protocol也相应发表在nature protocols上。不足五年,MQ的引用率已高达上万次,其中不乏CNS级别文章(有大佬的加持果然不一样)。毫不夸 阅读全文
posted @ 2020-08-28 23:48 生物信息与育种 阅读(17366) 评论(1) 推荐(0) 编辑
摘要:1.简介 PD全称Proteome Discoverer,是ThermoFisher在2008年推出的商业Windows软件,没错,收费,还不菲。而且主要也是针对他们家的obitrap产出数据。但在业内用得比较多,尤其是在学术界(因为大部分科研人员只会鼠标点点框)。蛋疼的是你就算买了软件还得配个Wi 阅读全文
posted @ 2020-08-28 21:33 生物信息与育种 阅读(6637) 评论(0) 推荐(0) 编辑
摘要:1.简介 MSGF+也是近年来应用得比较多的蛋白鉴定软件。java写的,2008年初次发表JPR,2014年升级发表NC,免费开源,持续更新维护,良心软件。而且,有研究者对不同蛋白质组学鉴定软件进行比较分析,MSGF+的表现也是非常不错的(一下子找不到文献出处~~)。 Github源码:https: 阅读全文
posted @ 2020-08-28 17:53 生物信息与育种 阅读(2101) 评论(0) 推荐(0) 编辑
摘要:1.简介 Mascot是非常经典的蛋白鉴定软件,被Frost & Sullivan形容为“质谱数据检索的黄金标准”,更新维护速度也很快(已发布到2.7版New features in Mascot Server 2.7)。but,它是商业软件(国内康昱盛代理),收费。虽然有在线版本,但仅支持少量谱图 阅读全文
posted @ 2020-08-28 16:39 生物信息与育种 阅读(4808) 评论(1) 推荐(0) 编辑
摘要:1.简介 官网:http://comet-ms.sourceforge.net/ 1993年开发,持续更新,免费开源 适用Windows/Linux 多线程,支持多种输入输出格式:输入谱图文件(mzXML, mzML, mgf, or ms2/cms2),输出.pep.xml/.pin.xml/.s 阅读全文
posted @ 2020-08-28 15:10 生物信息与育种 阅读(2044) 评论(0) 推荐(0) 编辑
摘要:1. 简介 X!Tandem是GPM:The Global Proteome Machine(主要基于Web的开源用户界面,用于分析和显示蛋白质鉴定数据。关于GPM的更多内容可参考https://www.thegpm.org/GPM/faq.html)中的一个成员,此外还有X! P3 、X! Hun 阅读全文
posted @ 2020-08-28 09:38 生物信息与育种 阅读(3106) 评论(0) 推荐(0) 编辑
摘要:遗传咨询简介 遗传疾病——专业知识——风险评估——沟通技巧——技术支持 咨询师工作流程 肿瘤基因检测 肿瘤发生的根本原因是基因突变 突变累积 一般发生到恶化要10年左右 样本类型和变异来源 约5%-10%的肿瘤与遗传基因有关,不同癌种略有不同(如卵巢癌20%以上) 多数遗传性肿瘤为常染色体显性遗传, 阅读全文
posted @ 2020-08-28 09:31 生物信息与育种 阅读(1140) 评论(0) 推荐(0) 编辑
摘要:解读相关专业术语 2个概念:胚系、体系突变 4种变异类型:SNV、Indel、融合/SV(大的易位/倒位/缺失)、CNV 2个免疫指标:TMB、MSI 3个权威机构指南:FDA(美国食品药品监管局)、NMPA(国家药品监管局)、NCCN(肿瘤学临床实践指南) 体系变异解读规则 癌症变异解读指南和标准 阅读全文
posted @ 2020-08-28 09:29 生物信息与育种 阅读(2702) 评论(0) 推荐(0) 编辑
摘要:遗传性肿瘤简介 遗传性肿瘤综合征:由于遗传性原因导致的染色体和基因异常,造成系统性肿瘤患病几率大大增加 germline variant:存在所有细胞中 somatic mutation:仅存在肿瘤细胞中 多数遗传性肿瘤为常染色体显性遗传(AD遗传):父母的致病突变有50%概率遗传给后代,外显不全( 阅读全文
posted @ 2020-08-28 09:28 生物信息与育种 阅读(3655) 评论(0) 推荐(0) 编辑
摘要:导论 表观遗传:非DNA决定的基因表达,或表型改变中可遗传因素的研究 DNA水平:甲基化(胞嘧啶(二代测序为主)5mC,腺嘌呤(三代为主)6mA,羟甲基化 RNA水平:甲基化,ncRNA 染色质水平:组蛋白修饰(甲基化/乙酰化/磷酸化/泛素化),核小体定位,染色质重塑和构象 DNA甲基化被广泛的应用 阅读全文
posted @ 2020-08-28 09:26 生物信息与育种 阅读(3847) 评论(0) 推荐(0) 编辑
摘要:基于二代测序的RNA癌症研究方法 基于DNA层面的癌症研究:一本字典 基于RNA的癌症研究:从字典种挑取写一篇日记 RNA特点: 时空特异性:需要控制变量对照组 协同作用,形式多样:表达量高低/可变剪接/单碱基突变/融合基因,mRNA/lncRNA/miRNA/ceRNA... 可控可逆,“温和”调 阅读全文
posted @ 2020-08-25 09:47 生物信息与育种 阅读(1280) 评论(0) 推荐(0) 编辑
摘要:肿瘤基因组分析 肿瘤进化过程 基本概念:germline/somatic/driver/passenger mutation 二次打击学说:生殖突变+体细胞突变 主要基于体细胞突变研究 发展趋势:小样本WES——大样本多组学;液体活检,免疫疗法,人工智能,微生物 肿瘤标准分析 肿瘤研究整体流程 测序 阅读全文
posted @ 2020-08-25 09:46 生物信息与育种 阅读(1738) 评论(0) 推荐(0) 编辑
摘要:前言 早发现,早治疗:2020统计中国每年新发恶性肿瘤392万例,死亡233.8万例,平均每分钟4.5人死亡 肿瘤检测发展:临床——病理——分子——精准 肿瘤十大特征 持续增殖:EGFR,Ras,Raf,P13K,mTOR 细胞能量代谢重编程 抵抗细胞死亡:P53,Bcl2家族,caspase家族 阅读全文
posted @ 2020-08-25 09:44 生物信息与育种 阅读(1478) 评论(0) 推荐(0) 编辑
摘要:1.基本概念 癌症是个很宽泛的概念/疾病。临床上的细致划分 异常增殖,长期发展,引发因素,基因突变+个人习惯+环境 病原感染/中国特色:乙肝病毒、HPV、EB病毒、幽门螺杆菌......,基因嵌入 突变积累 人类基因组计划与癌症基因组 基因突变类型 转录水平 表观遗传,CpG 癌基因与抑癌基因。大象 阅读全文
posted @ 2020-08-25 09:43 生物信息与育种 阅读(598) 评论(0) 推荐(0) 编辑
摘要:先来看一则招聘信息: 关于生物信息流程,不同的分类标准可能得到不一样的分类结果,比如: A review of bioinformatic pipeline frameworks这篇综述中,按照隐式公约框架、明确框架、配置框架和基于类的框架等对现代的生物信息流程框架进行分类。 生信分析流程构建的几大 阅读全文
posted @ 2020-08-11 22:57 生物信息与育种 阅读(2425) 评论(0) 推荐(0) 编辑
摘要:1. 简介 基于串联质谱的蛋白质组学大部分是依赖于数据库(database search)的bottom-up策略研究。也就是实际谱图和理论谱图进行匹配打分,从而实现肽段和蛋白的鉴定和定量。如果是DDA的数据,因为一张二级谱是一条肽段,直接将数据库理论酶切碎裂后的理论谱和实际谱图匹配即可。但如果是D 阅读全文
posted @ 2020-08-05 16:48 生物信息与育种 阅读(4868) 评论(1) 推荐(0) 编辑
摘要:搭建流程时,我们把各个模块脚本都写好了,现在通过编写主程序将模块串起来,那么怎么样依次(或者并行)将任务自动投递到集群呢?就是说这一步运行完之后,下一步自动运行。我们当然可以在脚本中设一个标志,反复检查这一个标志是否出现来决定是否运行下一步,但这种方法太原始,太多弊端了,耗内存,无法并行,且不可预料 阅读全文
posted @ 2020-08-04 16:13 生物信息与育种 阅读(1402) 评论(0) 推荐(0) 编辑
摘要:0. 一些基本概念 计算机集群:高性能集群(High Performance Computing,简称HPC)是一组松散或紧密连接在一起工作的计算机。由于这些计算机协同工作,在许多方面它们可以被视为单个系统。集群可以利用多个计算机进行并行计算从而获得很高的计算速度,也可以用多个计算机做备份,从而使得 阅读全文
posted @ 2020-08-04 12:42 生物信息与育种 阅读(1841) 评论(0) 推荐(0) 编辑
摘要:1. DML 数据操作指令 select 查 select 列 from 表 #取某列 select * from 表 #取全部 update 改 update 表 set 列=新值 where 列=某值 #更新列中某个值 update 表 set 列1=新值1, 列2=新值2 where 列=某值 阅读全文
posted @ 2020-08-02 21:09 生物信息与育种 阅读(265) 评论(0) 推荐(0) 编辑
摘要:传统化疗是对抗癌症的常见方法,但它会攻击全身,造成不必要的副作用,如脱发,恶心和疲劳。 靶向治疗选择性地杀死癌细胞而不影响健康组织。 靶向药物开发将成为治疗癌症的重要手段。 肿瘤的生物信息学数据库对肿瘤基础研究的发展、临床治疗水平提供具有重要作用。 1. 综合性肿瘤数据库 TCGA The Canc 阅读全文
posted @ 2020-08-01 17:37 生物信息与育种 阅读(15655) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示