会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小鬼 过来抱~
博客园
首页
新随笔
联系
订阅
管理
2024年3月26日
使用TensorRT-LLM部署ChatGLM3
摘要: 说明: TensorRT-LLM是NVIDIA开发的高性能推理 TensorRT-LLM 是 NVIDIA 推出的一个专门用于编译和优化大语言模型推理的综合程序库。 可在 NVIDIA GPU 上加速和优化最新的大语言模型(LLM)的推理性能。 官网地址为:https://github.com/TH
阅读全文
posted @ 2024-03-26 16:58 宝英姐姐
阅读(558)
评论(0)
推荐(0)
编辑