03 2025 档案

摘要:开源项目推荐 KubeAI KubeAI 是一个 K8s 上的 AI 推理操作器,旨在简化在生产环境中部署和管理大型语言模型(LLM)、向量嵌入和语音处理等机器学习模型。它提供与 OpenAI 兼容的 API,支持在 CPU 和 GPU 上运行,并具备按需自动扩缩容的能力。 KubeAI 无需依赖 阅读全文
posted @ 2025-03-03 17:30 kubesphere 阅读(18) 评论(0) 推荐(0) 编辑
摘要:首发:编码如写诗 前言 DeepSeek-R1 春节期间引爆AI市场,现在各大公司也都在部署本地私有化大模型。而昨日 KubeSphere 社区交出了一份新答卷,无需复杂步骤,一个可视化界面,几分钟完成大模型服务部署! K3s 是一个轻量级的 K8s 发行版,它希望在内存占用方面是 K8s的一半大小 阅读全文
posted @ 2025-03-03 13:36 kubesphere 阅读(83) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示