摘要: 在每次迭代时,我们都会对训练数据进行训练并评估测试数据,并以基于测试数据的评估结果为指导来选择和更改各种模型超参数,例如学习速率和特征。 多次重复执行流程可能导致我们不知不觉地拟合我们的特征测试集的特性。 上一个单元介绍了如何将数据集划分为训练集和测试集。这种划分,您可以对一个样本集进行训练,然后使 阅读全文
posted @ 2018-03-24 10:05 taro_秋刀鱼 阅读(275) 评论(0) 推荐(0) 编辑
摘要: 拆分训练集和测试集 图1 将单个数据集拆分为一个训练集和一个测试集 确保您的测试集满足以下两个条件: 规模足够大,可以参数具有统计意义的结果。 能代表整个数据集。换言之,挑选的测试集的特征应该与训练集的特征相同。 假设您的测试集满足上述两个条件,您的目标是创建一个能够很好地泛化到新数据的模型。我们的 阅读全文
posted @ 2018-03-24 10:04 taro_秋刀鱼 阅读(1029) 评论(0) 推荐(0) 编辑
摘要: 泛化 本单元将重点介绍泛华。为了让您直观地理解这一概念,我们将展示3张图片。假设每个点代表一棵树在深林中的位置。图中的两种颜色分别代表一下含义: 蓝点代表生病的树。 橙色代表健康的树。 接下来,我们来看看图1。 图1 生病(蓝色)和健康(橙色)的树 您能设想出一个有效的模型来预测以后的生病或健康的树 阅读全文
posted @ 2018-03-24 10:04 taro_秋刀鱼 阅读(594) 评论(0) 推荐(0) 编辑
摘要: 在梯度下降法中,批量指的是用于在单次迭代中计算梯度的样本总数。到目前为止,我们一直假定批量是指整个数据集。就 Google 的规模而言,数据集通常包含数十亿甚至数千亿个样本。此外,Google 数据集通常包含海量特征。因此,一个批量可能相当巨大。如果是超大批量,则单次迭代就可能要花费很长时间进行计算 阅读全文
posted @ 2018-03-24 10:03 taro_秋刀鱼 阅读(218) 评论(0) 推荐(0) 编辑
摘要: 正如之前所述,梯度矢量具有大小和方向。梯度下降算法用梯度乘以一个称为 学习速率 (有时候也称为 步长 )的标量,以确定下一个点的位置。例如,如果梯度大小为2.5,学习速率的大小为0.01,则梯度下降算法会选择距离前一个点0.025的位置作为下一个点。 超参数 是编程人员在机器学习算法中用于调整的按钮 阅读全文
posted @ 2018-03-24 10:02 taro_秋刀鱼 阅读(583) 评论(0) 推荐(0) 编辑
摘要: 假设我们有时间和计算资源来计算w1的所有可能值的损失。对于我们一直在研究的回归问题,所产生的损失与w1的图形始终是凸形。如下图所示: 图2 回归问题产生的损失与权重图为凸形 凸形问题只有一个最低点,即只存在一个斜率正好为0的位置。这个最小值就是损失函数收敛之处。 通过计算整个数据集中w1每个可能值的 阅读全文
posted @ 2018-03-24 09:56 taro_秋刀鱼 阅读(395) 评论(0) 推荐(0) 编辑
摘要: 下图显示了机器学习算法用于训练模型的迭代试错过程: 图1 用于训练模型的迭代方法 我们将在整个机器学习课程中使用相同的迭代方法详细说明各种复杂情况,尤其是上图中的蓝色区域。迭代策略在机器学习中的应用非常普遍,这主要是因为它们可以很好地扩展到大型数据集。 “模型”部分将一个或多个特征作为输入,然后返回 阅读全文
posted @ 2018-03-24 09:53 taro_秋刀鱼 阅读(185) 评论(0) 推荐(0) 编辑
摘要: 概述 训练模型表示通过有标签样本来学习确定所有的权重和偏差的理想值。在监督式学习中,机器学习算法通过以下方式构建模型:检查多个样本并尝试找出可最大限度地减少损失的模型;这个过程称为 经验风险最小化 。 损失是对糟糕预测的惩罚。也就是说, 损失 是一个数值,表示对于单个样本而言模型预测的准确程度。如果 阅读全文
posted @ 2018-03-24 09:51 taro_秋刀鱼 阅读(2917) 评论(0) 推荐(0) 编辑
摘要: 机器学习主要术语 监督式机器学习 机器学习系统通过学习如何组合输入信息来对从未见过的数据做出有用的预测。 标签 在简单的线性回归中,标签是我们要预测的事物,即y变量。标签可以是小麦的价格、图片中显示的动物品种、音频剪辑的含义或任何事物。 特征 在简单的线性回归中,特征是输入变量,即x变量。简单的机器 阅读全文
posted @ 2018-03-24 09:45 taro_秋刀鱼 阅读(254) 评论(0) 推荐(0) 编辑