2021年4月1日
摘要: 论文出自:Shazeer N, Mirhoseini A, Maziarz K, et al. Outrageously large neural networks: The sparsely-gated mixture-of-experts layer[J]. arXiv preprint arX 阅读全文
posted @ 2021-04-01 09:59 何雨龙 阅读(3082) 评论(0) 推荐(1) 编辑