摘要: 数据集区分 参考:11 模型选择 + 过拟合和欠拟合【动手学深度学习v2】_哔哩哔哩_bilibili 训练数据集 相当于平时作业题/练习题,用来训练模型(梯度下降更新权重、偏置最小化代价函数) 验证数据集 相当于模拟考试,用来调参(超参数:learning rate、batch size) 测试数 阅读全文
posted @ 2023-02-07 15:18 dctwan 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 损失函数 参考: “损失函数”是如何设计出来的?直观理解“最小二乘法”和“极大似然估计法”_哔哩哔哩_bilibili “交叉熵”如何做损失函数?打包理解“信息量”、“比特”、“熵”、“KL散度”、“交叉熵”_哔哩哔哩_bilibili 最小二乘法 所谓最小即梯度下降要找到使得损失函数最小的参数W和 阅读全文
posted @ 2023-02-07 09:50 dctwan 阅读(57) 评论(0) 推荐(0) 编辑