机器学习主要有:分类、聚类、回归、降维。通过python.sklearn接口函数进行基本的实现。

分类(监督学习)

通过特征矩阵,预测其对应的目标向量值y,若y离散,则是一个分类问题。

以鸢尾花数据及为例:

 

聚类(无监督学习)

只有特征矩阵,无目标向量的分类问题

降维

使特征矩阵列数减少,尽可能多的代表原始信息,但仍会损失信息

回归(监督学习)

对特征矩阵,预测其目标向量y,若y连续,则为回归