机器学习的基本概念

基本概念：

有监督学习，无监督学习，机器学习的分类，回归，什么情况过拟合，什么情况下欠拟合。

机器学习最常见的算法：

K最近邻算法，线性模型，朴素贝叶斯，决策树，随机森林，SVMs，神经网络。

不同的算法在不同的数据集上的表现不同。

主要任务是：建模，模型参数调整

建模的基础：数据进行降维，聚类，算法建模，数据处理，找到合适的模型，模型最优参数，

有监督学习：

通过对现有数据集进行建模，再用模型对新的数据样本进行分类或者回归分析的机器学习方法。训练数据集包含样本特征和分类标签，算法模型通过数据推断出分类，并应用到新样本中。

无监督学习：

对没有标签的训练数据集的数据进行分析并建模，主要是两类任务类型：数据转换（数据降维去除无关特征变量保留关键特征变量）和聚类分析（把样本划到不同分组的算法）

分类和回归是有监督学习中两个最常见的方法

分类：机器学习的目标是对样本的类标签进行预测，判断属于哪个分类，结果是离散的数值

回归分析：其目标要预测一个连续的数值或者范围

模型的泛化：有监督学习中，在训练数据集上建立一个模型，再把这个模型用于新的数据。希望模型对新数据的预测是准确的，这叫泛化的准确度。

过拟合：用测试数据集对模型表现进行评估，如果模型复杂在训练数据集上表现很好，但是在测试数据集上表现差，模型出现了过拟合。

欠拟合：模型过于简单，训练集上的数据特征都不能完全考虑到，这样的模型在训练数据集和测试数据集得分都较差，这叫欠拟合。

posted @ 2022-04-09 14:50 老牛小茂阅读(322) 评论(0) 收藏举报

刷新页面返回顶部

yeskey