摘要: 论文地址:https://arxiv.org/abs/1610.09650 主要思想 这篇文章就是用teacher student模型,用一个teacher模型来训练一个student模型,同时对teacher模型的输出结果加以噪声,然后来模拟多个teacher,这也是一种正则化的方法。 1. te 阅读全文
posted @ 2017-10-12 00:22 清水汪汪 阅读(1905) 评论(0) 推荐(0) 编辑