2021 年 2月 12 日随笔档案 - strategist_614

2021年2月12日

摘要：丢弃法深度学习模型常常使用丢弃法(dropout) 来应对过拟合问题。本节中提到的丢弃法特指倒置丢弃法（inverted dropout）输入个数为4，隐藏单元个数为5，且隐藏单元$h_i$（$i=1, \ldots, 5$）的计算表达式为 \(h_i = \phi\left(x_1 w_{ 阅读全文

posted @ 2021-02-12 17:14 strategist_614 阅读(126) 评论(0) 推荐(0) 编辑

3.11模型选择、欠拟合和过拟合

摘要： 3.11模型选择、欠拟合和过拟合 Dive Into Deep Learning 训练误差和泛化误差训练误差(train-error): 模型在训练数据集上表现出的误差泛化误差(generalization error): 模型在任意一个测试数据样本上表现出的误差的期望，并常常通过测试数据集上的阅读全文

posted @ 2021-02-12 16:00 strategist_614 阅读(302) 评论(0) 推荐(0) 编辑

3.12 权重衰减

摘要：权重衰减应对过拟合问题的常用方法：权重衰减（weight decay）方法权重衰减等价于$L_2$范数正则化（regularization） $L_2$范数正则化在模型原损失函数基础上添加$L_2$范数惩罚项，从而得到训练所需要最小化的函数.$L_2$范数惩罚项指的是模型权重参数每个元素的平方阅读全文

posted @ 2021-02-12 15:56 strategist_614 阅读(407) 评论(0) 推荐(0) 编辑

strategist_614

公告