2.模型训练流程
-
基础名词解释
-
样本:一条数据
-
特征:被观测对象的可测量特征,例如西瓜的颜色、瓜蒂、纹路、敲击声等
-
特征向量:用一个d维向量表征一个样本的所有或部分特征; 向量(数组) - [1,2,3]
-
标签/真实值:样本特征对应的真是类型或者真是取值,即正确答案
-
数据集(dataset):多条样本组成的集合
-
训练集(train):用于训练模型的数据集合
-
评估集(eval):用于在训练过程中周期性评估模型效果的数据集合
-
测试集(test):用于在训练完成后评估最终模型效果的数据集合
-
模型:可以从数据中学习到的,可以实现特定功能/映射的函数
-
误差/损失:样本真实值与预测值之间的误差
-
预测值:样本输入模型后输出的结果
-
模型训练:使用训练数据集对模型参数进行迭代更新的过程
-
模型收敛:任意输入样本对应的预测结果与真实标签之间的误差稳定
-
模型评估:使用测试数据和评估指标对训练完成的模型的效果进行评估的过程
-
模型推理/预测:使用训练好的模型对数据进行预测的过程
-
模型部署:使用服务加载训练好的模型,对外提供推理服务
- 机器学习任务流程
-
模型训练的基本流程
- 就是不断的修改模型参数,使真实值和预测值的 Loss(损失函数 - 误差)越来越小
- 就是不断的修改模型参数,使真实值和预测值的 Loss(损失函数 - 误差)越来越小
-
模型训练的详细流程
- 将训练数据集切成一个个batch切片
- batch : 一次输入到模型的样本数据条数(batch越大数据量就越大,对GPU压力就越大)
- Layer:层数 - 层数越多训练的数据越多,每一层的结构都一样但参数都不一样,每一个batch进来后参数就更新一次
- Activation:激活函数
- Forward propagation:正向传播 - 将前面输出的结果传给下一层
- Loss Function:损失函数 - 计算出误差
- Back propagation: 反向传播 - 一层一层更新模型参数(目的是使误差更小)
图中:Optimizer 为优化器
step:一次梯度更新的过程 (一次正向传播和反向传播的过程)
Epoch:模型完成一次完整训练集的训练(一个batch跑完一次为一个Epoch)
本文作者:little小新
本文链接:https://www.cnblogs.com/littlecc/p/18720900
版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步