摘要:
NaN 计算softmax loss时要用 "numeric robust 的计算方式" . softmax与 loss可能要分开计算. 得到前者的计算方式可以是常规方法. 但计算后者时要注意无穷大和NaN的出现. "NaN的出现" 一定是因为出现了无穷大. 无穷大的出现则是因为变量存储的数值超出了 阅读全文
摘要:
Reference https://groups.google.com/forum/ !msg/theano users/LRmXhTQtKAA/JmdyTzHiAwAJ 阅读全文