2024 年 2月 2 日随笔档案 - AlphaInf

2024年2月2日

摘要：写在前面事实证明，在部分情况下，依然有开启deepspeed的必要性这是上一篇文章，讲述使用双卡/8卡3090微调llama2-70B/13B模型 - AlphaInf - 博客园 (cnblogs.com) 但这一篇文章，存在下面的几个问题：如果训练的数据的seq_len过长，那么很有可能出阅读全文

posted @ 2024-02-02 19:00 AlphaInf 阅读(4590) 评论(1) 推荐(40) 编辑

基于vllm 0.3.0部署 llama2-70B模型

摘要：写在前面 VLLM框架升级了！ 0.3.0版本，拥有更高的推理速度（实测解析input的速度+40%），支持S-LoRA（一个主模型外套多个LoRA模型），很值得升级。本篇文章将会记录升级过程中遇到的坑爹事情硬件环境主板：PCIE 4.0 x16 GPU：8x 3090 内存： DDR4 76 阅读全文

posted @ 2024-02-02 01:30 AlphaInf 阅读(1469) 评论(0) 推荐(13) 编辑

$\mathit{AlphaINF}$

跑得快，不一定赢；稳如老狗，才能长久。

公告