监督学习与无监督学习
监督学习(supervised learning):我们给算法一个数据集,其中包含了正确答案。
回归问题(regression problem):预测连续值输出
分类问题(classification problem):我们设法预测一个离散值的输出(0或者1),但是在实际例子中,也可能会有两个以上的离散值输出
无监督学习(unpervised learning):我们所用的数据没有任何标签或者是都具有相同的标签,没有正确的答案。一般和聚类算法一起,把数据集分为不同的簇
聚类算法:可以将数据集分为若干簇