摘要: 1.小批量数据梯度下降 在大规模的应用中(比如ILSVRC挑战赛),训练数据可以达到百万级量级。如果像这样计算整个训练集,来获得仅仅一个参数的更新就太浪费了。一个常用的方法是计算训练集中的小批量(batches)数据。例如,在目前最高水平的卷积神经网络中,一个典型的小批量包含256个例子,而整个训练 阅读全文
posted @ 2022-08-18 22:51 TCcjx 阅读(24) 评论(0) 推荐(0) 编辑