2022年2月23日
摘要: 参考博客:https://blog.csdn.net/u012526436/article/details/86295971 讲解非常好! 模型使用 Layer normalization而不使用Batch normalization的原因见之前博客。 网络层数较深的时候会出现网络退化问题,就是层数 阅读全文
posted @ 2022-02-23 10:05 啥123 阅读(871) 评论(0) 推荐(0) 编辑