精简版SGD理解随机梯度下降过程

 1 #精简版SGD
 2 def SGD(self, training_data, epochs, mini_batch_size, eta,):
 3         n = len(training_data)
 4         # 进行epochs次主循环来计算weights和biases
 5         for j in xrange(epochs):
 6             # 每个主循环走一遍所有训练数据，并shuffle一下提供好的随机性
 7             random.shuffle(training_data)
 8             # 对于每个计算随机梯度的具体事件，设置一个mini_batch，用这mini_batch_size个样本来计算随机梯度
 9             mini_batches = [
10                 training_data[k:k+mini_batch_size]
11                 for k in xrange(0, n, mini_batch_size)]
12             # 计算随机梯度，更新weights和biases，eta是学习率
13             for mini_batch in mini_batches:
14                 self.update_mini_batch(mini_batch, eta)