摘要: LayerNorm和BatchNorm的归一化方式有以下主要区别: 归一化的维度不同: BatchNorm是在批次维度上进行归一化,即对每个特征维度上的所有样本进行归一化。例如,在一个包含多个样本的批次中,BatchNorm会计算每个特征在所有样本上的均值和方差,然后用这些值对每个样本的该特征进行归 阅读全文
posted @ 2025-03-24 09:54 GraphL 阅读(84) 评论(0) 推荐(0)