上一页 1 ··· 35 36 37 38 39 40 41 42 43 ··· 59 下一页
摘要: 1.分类规则原理 if-else逻辑:前件由特征值的特定组合构成,在满足规则的条件下,后件描述用来指定的分类值。 决策树必须从上至下应用,而规则是单独存在的事实。通常比决策树更简洁、直接和理解。 规则学习应用于以名义特征为主,或全部是名义特征的问题。 “独立而治之”:与决策树的**“分而治之”**不 阅读全文
posted @ 2020-09-02 21:57 生物信息与育种 阅读(1378) 评论(0) 推荐(0) 编辑
摘要: 1.决策树原理 决策树:树形结构流程图(漏斗型),模型本身包含一些列逻辑决策。数据分类从根节点开始,根据特征值遍历树上的各个决策节点。 几乎可应用于任何类型的数据建模,且性能不错。但当数据有大量多层次的名义特征或者大量的数值特征时,可能会生成一个过于复杂的决策树。 递归划分/分而治之:利用特征值将数 阅读全文
posted @ 2020-09-01 23:14 生物信息与育种 阅读(1933) 评论(0) 推荐(0) 编辑
摘要: 编写流程时,有一个好的习惯是将流程需要调用的软件、数据库等信息与脚本进行分离,这样可以统一管理流程的软件和数据库等信息,当它们路径改变或者升级的时候管理起来就很方便,而不需要去脚本中一个个寻找再修改。 在shell编程中,我们可以通过source config.txt来获取配置文件config.tx 阅读全文
posted @ 2020-09-01 18:11 生物信息与育种 阅读(500) 评论(0) 推荐(0) 编辑
摘要: 1. 组装算法 一般有基于OLC(Overlap-Layout-Consensus, 先重叠后扩展)和基于DBG(De Brujin Graph)两种组装算法。基于OLC的组装方法适合长序列组装,运行依赖的数据结构需要消耗大量的内存,且运行速度比较慢,错误率高,而DBG组装方法内存消耗相对较低,运算 阅读全文
posted @ 2020-09-01 16:47 生物信息与育种 阅读(7435) 评论(0) 推荐(1) 编辑
摘要: 1.理解朴素贝叶斯 1)基本概念 依据概率原则进行分类。如天气预测概率。 朴素贝叶斯(Naive Bayes, NB)适合场景:为估计一个结果的概率,从众多属性中提取的信息应该被同时考虑。 很多算法忽略了弱影响的特征(若有大量弱影响的特征,它们组合在一起的影响可能会很大),但NB算法利用了所有可以获 阅读全文
posted @ 2020-08-31 22:37 生物信息与育种 阅读(1860) 评论(0) 推荐(0) 编辑
摘要: 1.理解使用KNN进行分类 KNN特点 近邻分类器:一种懒惰学习器,即把未标记的案例归类为与它们最相似的带有标记的案例所在的类。当一个概念很难定义,但你看到它时知道它是什么,就适合用KNN分类。 KNN优点:简单有效;数据分布无要求;训练快 KNN缺点:不产生模型(发现特征间关系能力有限);分类慢; 阅读全文
posted @ 2020-08-30 20:36 生物信息与育种 阅读(1741) 评论(0) 推荐(1) 编辑
摘要: 1.基本概念 机器学习:发明算法将数据转化为智能行为 数据挖掘 VS 机器学习:前者侧重寻找有价值的信息,后者侧重执行已知的任务。后者是前者的先期准备 过程:数据——>抽象化——>一般化。或者:收集数据——推理数据——归纳数据——发现规律 抽象化: 训练:用一个特定模型来拟合数据集的过程 用方程来拟 阅读全文
posted @ 2020-08-29 15:49 生物信息与育种 阅读(1755) 评论(0) 推荐(2) 编辑
摘要: 2015年的综述文章,marker一下,供以后比较试用。蛋白质基因组学研究中的质谱仪与生物信息学方法。 针对蛋白质基因组学的分析研究,总结了质谱仪和蛋白质基因组学流程分析软件的选择,重点评述了常用的生物信息学计算工具,如PepLine 、Proteogenomic Mapping Tool InsP 阅读全文
posted @ 2020-08-28 23:58 生物信息与育种 阅读(368) 评论(0) 推荐(0) 编辑
摘要: 1.简介 2016年,德国马普所的Cox和蛋白质组学领域巨擘Matthias Mann合作开发了MaxQuant软件(MQ),并发表在nbt上,protocol也相应发表在nature protocols上。不足五年,MQ的引用率已高达上万次,其中不乏CNS级别文章(有大佬的加持果然不一样)。毫不夸 阅读全文
posted @ 2020-08-28 23:48 生物信息与育种 阅读(16448) 评论(1) 推荐(0) 编辑
摘要: 1.简介 PD全称Proteome Discoverer,是ThermoFisher在2008年推出的商业Windows软件,没错,收费,还不菲。而且主要也是针对他们家的obitrap产出数据。但在业内用得比较多,尤其是在学术界(因为大部分科研人员只会鼠标点点框)。蛋疼的是你就算买了软件还得配个Wi 阅读全文
posted @ 2020-08-28 21:33 生物信息与育种 阅读(6176) 评论(0) 推荐(0) 编辑
上一页 1 ··· 35 36 37 38 39 40 41 42 43 ··· 59 下一页