第一章 机器学习基础
机器学习的主要任务
监督学习
- 对于分类问题,机器学习的主要任务是将实例数据划分到合适的分类中,机器学习的另一项任务是回归,它主要用于预测数值型数据(数据拟合曲线)。
- 分类与回归属于监督学习,之所以称之为监督学习,是因为这类算法知道要预测什么,即目标变量的分类信息
无监督学习
- 对于监督学习,此时数据没有类别信息,也不会给定目标值
- 在无监督学习中,将数据集合分成由类似的对象组成的多个类的过程叫做聚类;
- 将寻找描述数据统计值的过程称之为密度估计
- 无监督学习还可以减少数据特征的维度,以便我们可以使用二维或三维图形更加直观地展示数据信息
监督学习的用途
k-近邻算法 | 线性回归 |
朴素贝叶斯算法 | 局部加权线性回归 |
支持向量机 |
Ridige回归 |
决策树 | Lasso最小回归系数估计 |
非监督学习的用途
K-均值 | 最大期望算法 |
DBSCAN | Parzen窗设计 |
如何选择合适的算法