摘要: 论文:https://arxiv.org/pdf/1811.05233.pdf 译文:大规模分布式SGD:瞬间训练完基于ImageNet的ResNet50 摘要 由于大mini-batch训练的不稳定性(为什么不稳定?),和梯度同步的开销,深度学习分布式训练很难线性扩展到拥有大量GPU的集群。我们通 阅读全文
posted @ 2019-08-17 14:02 happyyoung 阅读(1604) 评论(0) 推荐(0) 编辑
摘要: 论文:http://memray.me/uploads/acl17-keyphrase-generation.pdf 译文:深度关键短语生成 摘要 关键词提供高度总结的信息,可以用来有效地理解、组织和提取文本内容。虽然,前人的工作提供了很多可行的解决办法来自动提取关键短语 介绍 方法 本节介绍深度关 阅读全文
posted @ 2019-08-17 05:50 happyyoung 阅读(692) 评论(0) 推荐(0) 编辑