Seal软件

[置顶] GPUStack v2：推理加速释放算力潜能，开源重塑大模型推理下半场

摘要：

在大模型推理的下半场，GPUStack v2 不再是简单的模型服务平台，而是高性能推理生态的协调者与赋能者。阅读全文

posted @ 2025-11-26 16:19 Seal软件阅读(950) 评论(0) 推荐(0)

[置顶] GPUStack正式发布: 为大模型而生的开源GPU集群管理器

摘要：

GPUStack 正式发布并开源，一个用于运行 LLM（大型语言模型）的开源 GPU 集群管理器。阅读全文

posted @ 2024-07-26 16:15 Seal软件阅读(4463) 评论(2) 推荐(1)

2024年11月19日

配置NVIDIA Container Runtime和容器运行GPUStack教程

摘要：

配置 NVIDIA 容器运行时环境并使用容器方式运行 GPUStack 的操作教程阅读全文

posted @ 2024-11-19 10:57 Seal软件阅读(1586) 评论(0) 推荐(0)

2024年11月12日

RAG三件套运行的新选择 - GPUStack

摘要：

安装 GPUStack 和 Dify，并使用 Dify 来对接 GPUStack 部署的对话模型、Embedding 模型和 Reranker 模型。阅读全文

posted @ 2024-11-12 10:02 Seal软件阅读(1225) 评论(0) 推荐(0)

2024年11月7日

制作并量化GGUF模型上传到HuggingFace和ModelScope

摘要：

使用 llama.cpp 制作并量化 GGUF 模型，并将模型上传到 HuggingFace 和 ModelScope 模型仓库阅读全文

posted @ 2024-11-07 11:51 Seal软件阅读(983) 评论(0) 推荐(0)

2024年11月4日

在昇腾Ascend 910B上运行Qwen2.5推理

摘要：

使用 GPUStack 在昇腾 Ascend 910B 上运行 Qwen2.5 全系列的推理性能表现阅读全文

posted @ 2024-11-04 13:11 Seal软件阅读(4094) 评论(0) 推荐(1)

2024年4月29日

建立成功平台工程的关键：自助式 IaC

摘要：

了解团队部署自助式IaC的实践方法阅读全文

posted @ 2024-04-29 09:45 Seal软件阅读(144) 评论(0) 推荐(0)

2024年4月26日

不谈虚的，平台即产品真的有那么好吗？

摘要：

从开发者角度看PaaP，会关注哪些点？阅读全文

posted @ 2024-04-26 09:32 Seal软件阅读(98) 评论(0) 推荐(0)

2024年4月24日

API 开发的后盾：平台工程提供强力动态支持

摘要：

平台工程通过改进开发者体验、整合、管理内部API等方式，促进API开发阅读全文

posted @ 2024-04-24 10:19 Seal软件阅读(68) 评论(0) 推荐(0)

2024年4月22日

掌控基础设施，加速 DevOps 之旅：IaC 深度解析

摘要：

深入理解基础设计即代码，解析优势和最佳实践阅读全文

posted @ 2024-04-22 09:46 Seal软件阅读(174) 评论(0) 推荐(0)

公告