摘要: 优化算法 Batch梯度下降法每次对整个训练集进行计算,这在数据集很大时计算效率低下,因为每次更新权重前必须先处理整个训练集。 可以将训练集划分为多个小子集,称为mini-batch。每次只使用一个mini-batch来计算梯度并更新参数。取出 \(x^{(1)}\) 到 \(x^{(1000)}\ 阅读全文
posted @ 2024-11-21 15:35 钰见梵星 阅读(1) 评论(0) 推荐(0) 编辑