摘要:
从这张图片,可以看出。不管我们有多少层,都可以化简成最简形式。我们添加的层就没有意义。 所以我们要对每一层的输出做非线性变换,增加模型的复杂程度,使它没法化简 反向传播的流程 pytorch的tensor数据结构 看到代码,要能把计算图构建出来,而不是简单的乘除运算 在上面这张图,w是tensor数 阅读全文
摘要:
随机梯度下降可以跨越鞍点 对每一个样本的梯度进行更新 点击查看代码 import numpy as np import matplotlib.pyplot as plt x_data = [1.0, 2.0, 3.0] y_data = [2.0, 4.0, 6.0] w = 1.0 def for 阅读全文