Python机器学习3 - 机器学习开发流程
-
获取原始数据
-
拿到的数据不能全部用来训练一个模型。需要划分数据集。分为训练数据(训练、构建模型)和测试数据(在模型检验时使用,用于评估模型是否有效)
-
划分比例:训练集70%、75%、80%
-
-
数据处理
-
特征工程
-
机器学习算法训练,得到模型
-
模型评估(不合格的话返回到第二步)
-
应用(离线/在线服务)
获取原始数据
拿到的数据不能全部用来训练一个模型。需要划分数据集。分为训练数据(训练、构建模型)和测试数据(在模型检验时使用,用于评估模型是否有效)
划分比例:训练集70%、75%、80%
数据处理
特征工程
机器学习算法训练,得到模型
模型评估(不合格的话返回到第二步)
应用(离线/在线服务)