💡 有理想,但不妄想, 💭 有希望,但不奢望, 🐬 |

little小新

园龄:2年6个月粉丝:8关注:0

2.模型训练流程

  • 基础名词解释

  • 样本:一条数据

  • 特征:被观测对象的可测量特征,例如西瓜的颜色、瓜蒂、纹路、敲击声等

  • 特征向量:用一个d维向量表征一个样本的所有或部分特征; 向量(数组) - [1,2,3]

  • 标签/真实值:样本特征对应的真是类型或者真是取值,即正确答案

  • 数据集(dataset):多条样本组成的集合

  • 训练集(train):用于训练模型的数据集合

  • 评估集(eval):用于在训练过程中周期性评估模型效果的数据集合

  • 测试集(test):用于在训练完成后评估最终模型效果的数据集合

  • 模型:可以从数据中学习到的,可以实现特定功能/映射的函数

  • 误差/损失:样本真实值与预测值之间的误差

  • 预测值:样本输入模型后输出的结果

  • 模型训练:使用训练数据集对模型参数进行迭代更新的过程

  • 模型收敛:任意输入样本对应的预测结果与真实标签之间的误差稳定

  • 模型评估:使用测试数据和评估指标对训练完成的模型的效果进行评估的过程

  • 模型推理/预测:使用训练好的模型对数据进行预测的过程

  • 模型部署:使用服务加载训练好的模型,对外提供推理服务



  • 机器学习任务流程


  • 模型训练的基本流程

    • 就是不断的修改模型参数,使真实值和预测值的 Loss(损失函数 - 误差)越来越小
  • 模型训练的详细流程

    • 将训练数据集切成一个个batch切片
    • batch : 一次输入到模型的样本数据条数(batch越大数据量就越大,对GPU压力就越大)
    • Layer:层数 - 层数越多训练的数据越多,每一层的结构都一样但参数都不一样,每一个batch进来后参数就更新一次
    • Activation:激活函数
    • Forward propagation:正向传播 - 将前面输出的结果传给下一层
    • Loss Function:损失函数 - 计算出误差
    • Back propagation: 反向传播 - 一层一层更新模型参数(目的是使误差更小)

图中:Optimizer 为优化器
step:一次梯度更新的过程 (一次正向传播和反向传播的过程)
Epoch:模型完成一次完整训练集的训练(一个batch跑完一次为一个Epoch)

本文作者:little小新

本文链接:https://www.cnblogs.com/littlecc/p/18720900

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   little小新  阅读(4)  评论(0编辑  收藏  举报
点击右上角即可分享
微信分享提示
评论
收藏
关注
推荐
深色
回顶
收起