摘要: 在机器学习中,我们通常把样本分为训练集和测试集,训练集用于训练模型,测试集用于评估模型。在样本划分和模型验证的过程中,存在着不同的抽样方法和验证方法。 1)Holdout检验Holdout 检验是最简单也是最直接的验证方法,它将原始的样本集合随机划分成训练集和验证集两部分。比方说,对于一个点击率预测 阅读全文
posted @ 2022-06-29 20:26 合唱团abc 阅读(431) 评论(0) 推荐(0) 编辑
摘要: 插补: 1、特殊值填充(Treating Missing Attribute values as Special values) 将空值作为一种特殊的属性值来处理,它不同于其他的任何属性值。如所有的空值都用“unknown”填充。一般作为临时填充或中间过程。有时可能导致严重的数据偏离,一般不推荐。 阅读全文
posted @ 2022-06-29 08:46 合唱团abc 阅读(458) 评论(0) 推荐(0) 编辑