摘要: BN层在激活层之前,让模型量化损失最小。 阅读全文
posted @ 2024-11-12 11:36 张幼安 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 1. tf.keras.layers.Reshape会变成一个layer, 而tf.reshape只是一个计算;用tf.reshape训练假设得到100层的模型,tf.keras.reshape训练五层会有105层模型; 2. tf.keras.layers.Reshape会消耗更多的算力和内存; 阅读全文
posted @ 2024-11-12 09:59 张幼安 阅读(14) 评论(0) 推荐(0) 编辑