Google内部培训过1.8万人的机器学习速成课 - 未雨愁眸

公告

什么是（监督）机器学习？简而言之，它是以下几点：

我们来探讨基本的机器学习术语。

特征

一个特征是一个输入变量 - x简单线性回归中的变量。一个简单的机器学习项目可能会使用单一功能，而更复杂的机器学习项目可能会使用数百万个功能，具体如下：

在垃圾邮件检测器示例中，功能可能包括以下内容：

一个例子是数据的特定实例x。（我们把 X粗体，以表明它是一个载体。）我们分手的例子分为两类：

甲标记的例子包括（多个）特征和标签。那是：


labeled examples: {features, label}: (x, y)

使用标记的示例来训练模型。在我们的垃圾邮件检测器示例中，标记的示例将是用户明确标记为“垃圾邮件”或“非垃圾邮件”的单个电子邮件。例如，下表显示了来自包含加利福尼亚州房价信息的数据集中的 5个标记示例：

住房中医年龄（功能）	totalRooms （功能）	totalBedrooms （功能）	medianHouseValue （标签）
15	5612	1283	66900
19	7650	1901	80100
17	720	174	85700
14	1501	337	73400
20	1454	326	65500

一个未标记的例子包含的特征，但不是标签，如下：

  unlabeled examples: {features, ?}: (x, ?)

一旦我们用标记示例对我们的模型进行了训练，我们就可以使用该模型来预测未标记示例上的标签。在垃圾邮件检测器中，未标记的示例是人类尚未标记的新电子邮件。

模型定义了要素和标签之间的关系。例如，垃圾邮件检测模型可能会将某些功能强烈地与“垃圾邮件”相关联。让我们强调模型的两个阶段：

训练意味着创造或学习模型。也就是说，您将显示标有示例的模型，并使模型逐渐学习特征与标签之间的关系。
预测意味着将训练的模型应用于未标记的例子。也就是说，你使用训练好的模型进行有用的预测（y'）。例如，在推理过程中，您可以预测medianHouseValue新的未标记示例。

一个回归模型预测连续值。例如，回归模型预测回答如下问题：

一个分类模型预测离散值。例如，分类模型可以做出预测来回答以下问题：

关键术语

查看原文：http://www.mtcnn.com/?p=109

posted on 2018-03-01 19:24 未雨愁眸阅读(187) 评论(0) 收藏举报

刷新页面返回顶部