dwSun

一个很正经的IT工作者
中国非著名人工智能表演艺术家

导航

2018年7月11日 #

1503.02531-Distilling the Knowledge in a Neural Network.md

摘要: 原来交叉熵还有一个tempature,这个tempature有如下的定义: $$ q_i=\frac{e^{z_i/T}}{\sum_j{e^{z_j/T}}} $$ 其中T就是tempature,一般这个T取值就是1,如果提高: 也就是 Using a higher value for T pro 阅读全文

posted @ 2018-07-11 23:06 dwSun 阅读(255) 评论(0) 推荐(0) 编辑