随笔分类 - 机器学习
摘要:什么是评估机器学习模型 机器学习的目的是得到可以泛化(generalize)的模型,即在前所未见的数据上表现很好的模型,而过拟合则是核心难点。你只能控制可以观察的事情,所以能够可靠地衡量模型的泛化能力非常重要。 如何衡量泛化能力,即如何评估机器学习模型。 评估模型的重点是将数据划分为三个集合:训练集
阅读全文
摘要:对模型给予概率进行分类的手法称为概率分类法。给予概率是指对于模式X所对应的类别y的后验概率(y|x)进行学习。其所属类别为后验概率达到最大值时所对应的类别。 基于概率的模式识别的算法除了可以避免错误分类,还具有一个优势。就是的对多分类通常会有一个号的效果。 一、Logistic回归 首先,来看一下最
阅读全文
摘要:决策树(Decision Tree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象
阅读全文
摘要:一、循环神经网络简介 循环神经网络的主要用途是处理和预测序列数据。循环神经网络刻画了一个序列当前的输出与之前信息的关系。从网络结构上,循环神经网络会记忆之前的信息,并利用之前的信息影响后面节点的输出。 下图展示了一个典型的循环神经网络。 循环神经网络的一个重要的概念就是时刻。上图中循环神经网络的主体
阅读全文
摘要:在机器学习的过程中,我们经常会遇见过拟合的问题。而输入数据或features的维度过高就是导致过拟合的问题之一。。维度越高,你的数据在每个特征维度上的分布就越稀疏,这对机器学习算法基本都是灾难性的。所有出现了很多降维的方法。今天我们要讨论的就是LDA降维。 LDA降维的思路是:如果两类数据线性可分,
阅读全文