课程5-笔记-书生浦语大模型实战营-5
一、大模型部署
1、模型部署及大模型特点
![](https://pic1.zhimg.com/80/v2-e72fbcf44a3b53c61078d40faa2bf744_1440w.webp)
2、大模型部署遇到的问题及解决方案
![](https://pic1.zhimg.com/80/v2-0932bdc97594427f949f5008e30c83bc_1440w.webp)
模型部署存在的问题:1、硬件需求相对较大,特别在于显卡及内存方面。2、由于模型较大,则速度就会很慢
优化方法:1、在卷积神经网络中是有:剪枝、量化及其他。2、大模型中有:太通透了!大模型训练和推理优化技术最全汇总! - 知乎 (zhihu.com)
二、LMDeploy 略
![](https://pic4.zhimg.com/80/v2-7919a05f1118065033726b3e9daee943_1440w.webp)
![](https://pic2.zhimg.com/80/v2-1e14b83f7f25a13be4bafd9c1c16a4cd_1440w.webp)
一、大模型部署
1、模型部署及大模型特点
2、大模型部署遇到的问题及解决方案
模型部署存在的问题:1、硬件需求相对较大,特别在于显卡及内存方面。2、由于模型较大,则速度就会很慢
优化方法:1、在卷积神经网络中是有:剪枝、量化及其他。2、大模型中有:太通透了!大模型训练和推理优化技术最全汇总! - 知乎 (zhihu.com)
二、LMDeploy 略