摘要: 一、训练及验证模型的方法 最佳模型:在测试数据集(或者相对于模型来说是全新的数据集)上表现的比较好的模型,因为这种模型的泛化能力强,放在生成环境中面对未知的环境时有更好的表现。 调整的参数通常就是超参数:kNN 中的 k 和 P 、多项式回归中的 degree 等; 通常调参时使用交叉验证的方法。 阅读全文
posted @ 2018-07-10 22:23 何永灿 阅读(2380) 评论(0) 推荐(0) 编辑
摘要: 一、基础理解 学习曲线作用: 学习曲线:随着训练样本的逐渐增多,算法训练出的模型的表现能力; 表现能力:也就是模型的预测准确率,使用均方误差表示;学习率上体现了模型相对于训练集和测试集两类数据的均方误差。 具体的操作: 具体的操作: 二、实例 1)模拟数据集 数据集 import numpy as 阅读全文
posted @ 2018-07-10 21:24 何永灿 阅读(12939) 评论(1) 推荐(2) 编辑
摘要: 一、基础理解 1)训练模型的目的 训练模型不是为了最大程度的拟合样本点,而是为了获得一个可以预测的模型,当有了新的样本时,该模型可以给出很好的解答,因此衡量模型对于训练数据集的拟合程度时是没有意义的,我们真正需要的是该模型的泛化能力; 均方误差:描述两组数之间的相同程度; 机器学习领域,用模型在 X 阅读全文
posted @ 2018-07-10 09:53 何永灿 阅读(1553) 评论(0) 推荐(0) 编辑