摘要: from_logits是一个布尔量,当from_logits=True的时候,该层会将output做normalize(softmax) 因此,一个直观的理解就是layerA with activation + softmax + loss(from_logits=False)与layerA + l 阅读全文
posted @ 2021-04-08 22:13 Harry666 阅读(1195) 评论(0) 推荐(0) 编辑