摘要: 在深度学习训练中,我们经常遇到 GPU 的内存太小的问题,如果我们的数据量比较大,别说大批量(large batch size)训练了,有时候甚至连一个训练样本都放不下。但是随机梯度下降(SGD)中,如果能使用更大的 Batch Size 训练,一般能得到更好的结果。所以问题来了: 问题来了:当 G 阅读全文
posted @ 2018-12-26 09:40 leizhao 阅读(2064) 评论(0) 推荐(0) 编辑
摘要: 大部分情况下,设置这个 flag 可以让内置的 cuDNN 的 auto-tuner 自动寻找最适合当前配置的高效算法,来达到优化运行效率的问题。 一般来讲,应该遵循以下准则: 阅读全文
posted @ 2018-12-26 09:26 leizhao 阅读(4072) 评论(0) 推荐(2) 编辑