通过监督学习对未来事件进行预测
监督学习的主要目的是使用有类标(label)的训练(training)数据构建模型,我们可以使用经训练得到的模型对未来数据进行预测。此处,术语监督是指训练数据集中的每个样本均有一个已知的输出型。监督学习一般使用离散的类标(class label),被称为分类。监督学习的另一个子类是回归(regression),回归问题的输出型是连续值
分类的任务就是将具有类别的。无序类标分配给各个新样本。另一类监督学习方法针对连续型输出变量进行预测,也就是所谓的回归分析。在回归分析中,数据中会给出大量的自变量(解释变量)和相应的连续因变量(输出结果),通过尝试寻找这两种变量之间的关系,就能够预测输出变量。