摘要: 优化算法主要用于调整神经网络中的超参数,使得训练数据集上的损失函数尽可能小。其核心逻辑是通过计算损失函数对参数的梯度(导数)来确定参数更新方向。 SGD Stochastic Gradient Descent(随机梯度下降法):随机梯度下降算法是一种改进的梯度下降方法,它在每次更新参数时,只随机选择 阅读全文
posted @ 2023-12-18 16:42 又见阿郎 阅读(343) 评论(0) 推荐(0) 编辑