摘要: 今天跑一个模型,程序都没变,就配置文件变了。但是总是很快就显示loss为nan.检查配置文件还是不行,把其中loss改为0还是不行。最后搁置了一下,再回头对比一下电脑上的和服务器上的,发现一个配置文件的初始学习率设置是0.01,而我要做的是ft,要从0.001开始,于是改掉从新跑上模型。大松一口气啊... 阅读全文
posted @ 2015-10-07 19:32 caoeryingzi 阅读(283) 评论(0) 推荐(0) 编辑