课程5-笔记-书生浦语大模型实战营-5

一、大模型部署

1、模型部署及大模型特点

模型大,token不固定,结构简单

2、大模型部署遇到的问题及解决方案

硬件、速度、技术、方案

模型部署存在的问题:1、硬件需求相对较大,特别在于显卡及内存方面。2、由于模型较大,则速度就会很慢

优化方法:1、在卷积神经网络中是有:剪枝、量化及其他。2、大模型中有:太通透了!大模型训练和推理优化技术最全汇总! - 知乎 (zhihu.com)

二、LMDeploy 略

解决方案
 

 

posted @   russellwang  阅读(4)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 阿里最新开源QwQ-32B,效果媲美deepseek-r1满血版,部署成本又又又降低了!
· 单线程的Redis速度为什么快?
· SQL Server 2025 AI相关能力初探
· 展开说说关于C#中ORM框架的用法!
· AI编程工具终极对决:字节Trae VS Cursor,谁才是开发者新宠?
点击右上角即可分享
微信分享提示