摘要: 今天尝试本地部署了 Qwen2-72B-Instruct-GPTQ-Int4 模型,这里记录一下操作的过程。 参考: https://qwen.readthedocs.io/zh-cn/latest/deployment/vllm.html https://docs.vllm.ai/en/stabl 阅读全文
posted @ 2024-08-24 20:46 Eslzzyl 阅读(2964) 评论(0) 推荐(0) 编辑