机器学习概览
机器学习可以根据训练时的量和类进行分类:
-
监督学习
-
在监督学习中,用来训练的数据包含了答案,成为标签
-
实例:
-
一个典型的监督学习任务是分类。垃圾邮件过滤器就是一个很好的例子:用许多带有归类 (垃圾邮件或普通邮件)的邮件样本进行训练,过滤器必须还能对新邮件进行分类。
-
另一个典型任务是预测目标数值,例如给出一些特征(里程数、车龄、品牌等等)称作预测值,来预测一辆汽车的价格。这类任务称作 回归
一些回归算法也可以用来分类,反之亦然
算法:
-
K近邻算法
-
线性回归
-
逻辑回归
-
支持向量机(SVM)
-
决策树和随机森林
-
神经网络
-
非监督学习
训练数据没有加标签的
-
聚类
-
K均值
-
层次聚类分析
-
期望最大值
-
可视化和降维
-
主成分分析
-
核主成分分析
-
局部线性嵌入
-
t-分布邻域嵌入算法
-
关联性规则学习
-
Apriori算法
-
Eclat算法
-
半监督学习
一些算法可以处理部分带标签的训练数据,通常是大量不带标签数据加上小部分带标签数据。这称作半监督学习
-
强化学习