dense layer:mnist识别中,需要十组dense权重矩阵来计算这十个输出内容,conv矩阵每一个元素乘以另一个矩阵的元素并相加,得到一个值,最后加上sigmoid(softmax在二元情况下就是sihgmoid)得到一个值。

什么时候需要在conv后加max pooling--未知
why需要max pooling?(1)max。。具有平移不变性(2)max..后,意味着3*3卷积有效覆盖了更大部分的原始图像,也就意味着我们的卷积能够找到更多、更复杂的特征
capsule胶囊的结构

SGD:根据每个变量的权重对loss函数的影响,来更改变量值

鞍点:在神经网络,在一个维度中呈平面形状的叫做鞍点--在微分方程中,沿着某一方向是稳定的,另一条方向是不稳定的奇点,叫做鞍点。在泛函中,既不是极大值点也不是极小值点的临界点,叫做鞍点。

伪标签:test集合预测得到的label当作真正的label
---》自己搭的工具MixIterator,建立训练标签、验证集标签和测试集的伪标签的三个batches的组合
keras工具组中:有一个sampleweight(样本权重)的工具