机器学习的基本概念

基本概念:

有监督学习,无监督学习,机器学习的分类,回归,什么情况过拟合,什么情况下欠拟合。

机器学习最常见的算法:

K最近邻算法,线性模型,朴素贝叶斯,决策树,随机森林,SVMs,神经网络。

不同的算法在不同的数据集上的表现不同。

主要任务是:建模,模型参数调整

建模的基础:数据进行降维,聚类,算法建模,数据处理,找到合适的模型,模型最优参数,

有监督学习:

通过对现有数据集进行建模,再用模型对新的数据样本进行分类或者回归分析的机器学习方法。训练数据集包含样本特征和分类标签,算法模型通过数据推断出分类,并应用到新样本中。

无监督学习:

对没有标签的训练数据集的数据进行分析并建模,主要是两类任务类型:数据转换(数据降维去除无关特征变量保留关键特征变量)和聚类分析(把样本划到不同分组的算法)

分类和回归是有监督学习中两个最常见的方法

分类:机器学习的目标是对样本的类标签进行预测,判断属于哪个分类,结果是离散的数值

回归分析:其目标要预测一个连续的数值或者范围

模型的泛化:有监督学习中,在训练数据集上建立一个模型,再把这个模型用于新的数据。希望模型对新数据的预测是准确的,这叫泛化的准确度。

过拟合:用测试数据集对模型表现进行评估,如果模型复杂在训练数据集上表现很好,但是在测试数据集上表现差,模型出现了过拟合。

欠拟合:模型过于简单,训练集上的数据特征都不能完全考虑到,这样的模型在训练数据集和测试数据集得分都较差,这叫欠拟合。

posted @   老牛小茂  阅读(295)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 单线程的Redis速度为什么快?
· 展开说说关于C#中ORM框架的用法!
· Pantheons:用 TypeScript 打造主流大模型对话的一站式集成库
· SQL Server 2025 AI相关能力初探
· 为什么 退出登录 或 修改密码 无法使 token 失效
点击右上角即可分享
微信分享提示