2024 年 12月 14 日随笔档案 - boydfd - 博客园

2024年12月14日

为了改一行代码，我花了10多天时间，让性能提升了40多倍---Pascal架构GPU在vllm下的模型推理优化

摘要： ChatGPT生成的文章摘要这篇博客记录了作者在家中使用Pascal显卡运行大型模型时遇到的挑战和解决方案。随着本地大型模型性能的提升，作者选择使用vllm库进行推理。然而，作者遇到了多个技术难题，需要自行编译vllm和PyTorch，以支持Pascal架构的显卡。编译过程中，作者深入研究了显卡不阅读全文

posted @ 2024-12-14 13:07 boydfd 阅读(1755) 评论(8) 推荐(8) 编辑

公告

昵称： boydfd
园龄： 9年3个月
粉丝： 64
关注： 0

<

2025年3月

>

日

一

二

三

四

五

六

23

24

25

26

27

28

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

31

1

2

3

4

5

随笔分类 (27)

effective modern c++ 翻译(27)

随笔档案 (112)

阅读排行榜

评论排行榜

推荐排行榜

最新评论

1. Re:为了改一行代码，我花了10多天时间，让性能提升了40多倍---Pascal架构GPU在vllm下的模型推理优化
@boydfd 时间多就无所谓啦，不过这些源码看完了可以提个issue，以后可以当亮点...
--^.*?$
2. Re:为了改一行代码，我花了10多天时间，让性能提升了40多倍---Pascal架构GPU在vllm下的模型推理优化
@园友3541480 搜索了一圈才发现，我忘记提我自己的显卡型号了，尴尬~...
--boydfd
3. Re:为了改一行代码，我花了10多天时间，让性能提升了40多倍---Pascal架构GPU在vllm下的模型推理优化
当时我还想1080只有11gb显存啊，，，原来还有个titan x和titan xp
--园友3541480
4. Re:为了改一行代码，我花了10多天时间，让性能提升了40多倍---Pascal架构GPU在vllm下的模型推理优化
@^.*?$ 感谢给的建议哈，一开始只是想着把当时的思考情绪也给展现出来，你这么一说确实显得太过繁琐了。但是这篇估计也没时间改了，下次写文章的时候会注意一下的。至于分析源码部分，这个对于我来说真不一...
--boydfd
5. Re:为了改一行代码，我花了10多天时间，让性能提升了40多倍---Pascal架构GPU在vllm下的模型推理优化
厉害，厉害
--Angry_Panda