摘要:
摘要:针对现有长序列训练场景的痛点,MindSpeed在并行算法、计算效率、内存占用以及通信四个维度系统性优化大模型长序列训练效率,支持大模型百万级长序列训练。 1 长序列已经成为主流大模型能力之一 23年底Gemini1.5 Pro发布以来,大模型序列长度迅速增长,处理超长序列上下文(Contex 阅读全文
摘要:
摘要:基于派摩公司的三大痛点,DTSE为其提供了专业的解决方案。基于RDS for MySQL+DCS+EVS+OBS替换其他云厂商MySQL+Redis+oss。 本文分享自华为云社区《派摩商城全栈搬迁,高效协作,实现平台数字化转型》,作者: HuaweiCloudDeveloper。 背景 伴随 阅读全文