摘要: NaN 计算softmax loss时要用 "numeric robust 的计算方式" . softmax与 loss可能要分开计算. 得到前者的计算方式可以是常规方法. 但计算后者时要注意无穷大和NaN的出现. "NaN的出现" 一定是因为出现了无穷大. 无穷大的出现则是因为变量存储的数值超出了 阅读全文
posted @ 2017-01-08 20:26 宁静是一种习惯 阅读(1687) 评论(0) 推荐(0) 编辑
摘要: Reference https://groups.google.com/forum/ !msg/theano users/LRmXhTQtKAA/JmdyTzHiAwAJ 阅读全文
posted @ 2017-01-08 15:08 宁静是一种习惯 阅读(641) 评论(0) 推荐(0) 编辑