摘要: 本文翻译节选自1998-Efficient BackProp, Yann LeCun et al..4.1 随机VS批训练每一次迭代, 传统训练方式都需要遍历所有数据集来计算平均梯度. 批训练也同样. 但你也可以使用随机训练的方法: 每次随机选择一个样本$\{Z^t, D^t\}$. 使用它来计算对... 阅读全文
posted @ 2015-01-28 20:18 Lancelod_Liu 阅读(749) 评论(0) 推荐(0) 编辑