2023 年 7月 27 日随笔档案 - deephub

2023年7月27日

摘要：这是微软发布在2022 ICML的论文，MoE可以降低训练成本，但是快速的MoE模型推理仍然是一个未解决的问题。所以论文提出了一个端到端的MoE训练和推理解决方案DeepSpeed-MoE：它包括新颖的MoE架构设计和模型压缩技术，可将MoE模型大小减少3.7倍；通过高度优化的推理系统，减少了7.3 阅读全文

posted @ 2023-07-27 09:56 deephub 阅读(98) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

公告