09 2019 档案

batch size的设定

摘要：这两天在调参的时候，模型在batch_size=32时收敛得很好，performance也不错。但是发现GPU显存利用率很低，于是设置成batch_size=256，结果显卡利用率高了，模型不收敛。 batch_size小：一个epoch需要的时间长；可能出现训练不稳定（因为最后计算出的loss是对阅读全文

posted @ 2019-09-23 15:41 拎壶冲AR 阅读(1066) 评论(0) 推荐(0) 编辑

公告

昵称：拎壶冲AR
园龄： 5年11个月
粉丝： 6
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

1万小时定律

09 2019 档案

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

文章档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论