摘要:
1. SGD训练时,初始化学习率为0.05时,loss出现了 nan (百度: pytorch loss nan, 但是目前暂未看懂解释,大概是loss出现了inf,学习率偏大?) 阅读全文
摘要:
参考: https://blog.csdn.net/Riverhope/article/details/78922006 vstack,vertical 垂直堆叠 hstack, horizontal 水平堆叠 注意:使用时可以空初始化: vstack垂直堆叠要求列必须初始化(列数对齐) hstac 阅读全文