监督学习和无监督学习
机器学习:定义一、给予计算机能自我学习的能力而不是编程。定义二、对于某类任务T和性能度量P,如果一个计算机程序在T上以P衡量的性能随着经验E而自我完善,那么我们称这个计算机程序在从经验E学习
监督学习
在有监督的学习中,我们得到了一个数据集,并且已经知道正确的输出应该是什么样的,我们认为输入和输出之间是有关系的。
监督学习问题分为回归问题和分类问题。在回归问题中,我们试图在连续输出中预测结果,这意味着我们试图将输入变量映射到某个连续函数。在分类问题中,我们试图预测离散输出的结果。换句话说,我们试图将输入变量映射到离散的类别中。
无监督学习
无监督学习使我们能够在不知道结果应该是什么的情况下处理问题。我们可以从不一定知道变量影响的数据中导出结构。
我们可以根据数据中变量之间的关系对数据进行聚类,从而得出这种结构。
对于无监督学习,没有基于预测结果的反馈。
例子:
聚类:收集1000000个不同的基因,并找到一种方法自动将这些基因分组,这些分组以某种方式相似或由不同变量相关,如寿命、位置、角色等。
非聚类:鸡尾酒会算法,允许你在混乱的环境中找到结构。(即在鸡尾酒会上从许多声音中识别出个人的声音和音乐)。