书生开源大模型训练营-第5讲-笔记
摘要:
1、大模型部署的背景 a、大模型部署的挑战 对设备的要求:存储大 推理:生成token的速度、动态shape、内存管理 服务:高并发下的吞吐量、单用户的响应时间 b、技术方案: 模型并行、量化 Transfomer优化、推理优化 2、LMDeploy介绍 a、是在N卡上的全流程方案,包括轻量化、推理 阅读全文
posted @ 2024-02-18 20:50 littlesuccess 阅读(13) 评论(0) 推荐(0) 编辑