摘要: batch_size就是为了让模型根据每个batch,去计算梯度,太大太小都不行,这个对模型的拟合是非常非常重要的 training sample=2918时,batch_size = 256无论怎么训练,都无法拟合(或者应该shuffle?) 而设置成64的时候,虽然训练比较慢,但是最终的拟合结果 阅读全文
posted @ 2019-11-26 10:27 yjy888 阅读(1544) 评论(0) 推荐(0) 编辑