摘要: 一般情况下我们使用一个batch的数据计算出一个平均的loss,再使用这个loss反向传播求得模型参数的梯度并更新,例如: loss = tf.reduce_mean(y - y_pred) # 文中y和y_pred的shape均为:[b, 1],其中b是batch_size. 这种情况比较好理解, 阅读全文
posted @ 2021-11-07 13:51 风和雨滴 阅读(1637) 评论(0) 推荐(0) 编辑