LitServe 快速进行ai 模型服务的引擎

LitServe 是一个使用简单的基于fastapi 开发方的ai 服务引擎,支持批处理以及streaming 模式

包含的特性

  • 灵活的扩展能力,支持callback 以及中间件模式,对于request 以及response 进行修改
  • 完全控制,可以运行单个或者多个模型进行推理服务
  • 构建组合ai 系统
  • 自动缩放
  • 多worker 支持
  • 支持batch
  • 支持多GPU
  • openai 指南实现
  • streaming 模式支持
  • llm 服务支持
  • 认证支持

说明

litgpt 就是基于LitServe 开发的,支持的功能还是很多的,对于快速开发ai api 服务还是比较方便的,很值得尝试下,当然不少特别是需要Lightning-AI 平台支持的,Lightning-AI 平台提供的能力还是很多的

参考资料

https://github.com/Lightning-AI/LitServe
https://lightning.ai/docs/litserve
https://github.com/Lightning-AI/litgpt
https://lightning.ai/docs/litserve/features

posted on 2024-11-07 08:00  荣锋亮  阅读(14)  评论(0编辑  收藏  举报

导航