2024 年 4月 26 日随笔档案 - linzm14

2024年4月26日

vllm 通过不同的chat_template推理部署常见qwen、chatglm、llama3等开源大模型

摘要： vllm 版本 4.0.0 镜像 vllm github 官方镜像 gpu v100 32g a800 80g openai api 方式出现的问题通过 chat-template 聊天模板解决 1 推理部署qwen系列模型测试我是谁问题：回答内容含有分词符，回答有杂论冗余内容模型文件没有阅读全文

posted @ 2024-04-26 15:52 linzm14 阅读(2937) 评论(3) 推荐(0) 编辑

linzm14

公告