摘要: 过拟合 作为机器学习科学家,我们的目标是发现模式(pattern)。 但是,我们如何才能确定模型是真正发现了一种泛化的模式, 而不是简单地记住了数据呢? 例如,我们想要在患者的基因数据与痴呆状态之间寻找模式, 其中标签是从集合痴呆轻度认知障碍健康中提取的。 因为基因可以唯一确定每个个体(不考虑双胞胎 阅读全文
posted @ 2023-10-27 14:50 Yohoc 阅读(20) 评论(0) 推荐(0) 编辑
摘要: 在分类问题中,我们通常使用交叉熵损失,而不是平方误差损失的主要原因是: 输出解释不同。分类使用概率,而回归使用具体预测值。交叉熵更适合度量概率分布之间的距离 阅读全文
posted @ 2023-10-27 14:40 Yohoc 阅读(54) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2023-10-27 14:06 Yohoc 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 线性模型的局限性 例如,线性意味着单调假设: 任何特征的增大都会导致模型输出的增大(如果对应的权重为正), 或者导致模型输出的减小(如果对应的权重为负)。 有时这是有道理的。 例如,如果我们试图预测一个人是否会偿还贷款。 我们可以认为,在其他条件不变的情况下, 收入较高的申请人比收入较低的申请人更有 阅读全文
posted @ 2023-10-27 10:37 Yohoc 阅读(24) 评论(0) 推荐(0) 编辑