会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
Seal软件
博客园
首页
新随笔
联系
订阅
管理
随笔 - 272
文章 - 0
评论 - 23
阅读 -
91666
[置顶]
GPUStack v0.4:文生图模型、语音模型、推理引擎版本管理、离线支持和部署本地模型
摘要:
千呼万唤,GPUStack 迄今最受用户关注、超多新功能的版本重磅发布!
阅读全文
posted @ 2024-12-09 10:20 Seal软件
阅读(217)
评论(0)
推荐(0)
编辑
[置顶]
在昇腾Ascend 910B上运行Qwen2.5推理
摘要:
使用 GPUStack 在昇腾 Ascend 910B 上运行 Qwen2.5 全系列的推理性能表现
阅读全文
posted @ 2024-11-04 13:11 Seal软件
阅读(1601)
评论(0)
推荐(1)
编辑
[置顶]
GPUStack正式发布: 为大模型而生的开源GPU集群管理器
摘要:
GPUStack 正式发布并开源,一个用于运行 LLM(大型语言模型)的开源 GPU 集群管理器。
阅读全文
posted @ 2024-07-26 16:15 Seal软件
阅读(1516)
评论(2)
推荐(0)
编辑
2024年11月19日
配置NVIDIA Container Runtime和容器运行GPUStack教程
摘要:
配置 NVIDIA 容器运行时环境并使用容器方式运行 GPUStack 的操作教程
阅读全文
posted @ 2024-11-19 10:57 Seal软件
阅读(309)
评论(0)
推荐(0)
编辑
2024年11月12日
RAG三件套运行的新选择 - GPUStack
摘要:
安装 GPUStack 和 Dify,并使用 Dify 来对接 GPUStack 部署的对话模型、Embedding 模型和 Reranker 模型。
阅读全文
posted @ 2024-11-12 10:02 Seal软件
阅读(308)
评论(0)
推荐(0)
编辑
2024年11月7日
制作并量化GGUF模型上传到HuggingFace和ModelScope
摘要:
使用 llama.cpp 制作并量化 GGUF 模型,并将模型上传到 HuggingFace 和 ModelScope 模型仓库
阅读全文
posted @ 2024-11-07 11:51 Seal软件
阅读(269)
评论(0)
推荐(0)
编辑
2024年9月19日
GPUStack 0.2:开箱即用的分布式推理、CPU推理和调度策略
摘要:
单机多卡分布式推理、跨主机分布式推理、CPU 推理、各种调度策略,你想要的全都有
阅读全文
posted @ 2024-09-19 10:11 Seal软件
阅读(537)
评论(0)
推荐(0)
编辑
2024年4月29日
建立成功平台工程的关键:自助式 IaC
摘要:
了解团队部署自助式IaC的实践方法
阅读全文
posted @ 2024-04-29 09:45 Seal软件
阅读(88)
评论(0)
推荐(0)
编辑
2024年4月26日
不谈虚的,平台即产品真的有那么好吗?
摘要:
从开发者角度看PaaP,会关注哪些点?
阅读全文
posted @ 2024-04-26 09:32 Seal软件
阅读(55)
评论(0)
推荐(0)
编辑
2024年4月24日
API 开发的后盾:平台工程提供强力动态支持
摘要:
平台工程通过改进开发者体验、整合、管理内部API等方式,促进API开发
阅读全文
posted @ 2024-04-24 10:19 Seal软件
阅读(35)
评论(0)
推荐(0)
编辑
下一页
公告
昵称:
Seal软件
园龄:
2年8个月
粉丝:
21
关注:
0
+加关注
<
2025年2月
>
日
一
二
三
四
五
六
26
27
28
29
30
31
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
1
2
3
4
5
6
7
8
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
我的标签
AI
(16)
LLM
(9)
人工智能
(7)
GenAI
(6)
大模型
(6)
GPU集群
(3)
GPU
(2)
Whisper
(1)
Text-to-Speech
(1)
Stable Diffusion
(1)
更多
随笔档案
2024年12月(1)
2024年11月(4)
2024年9月(1)
2024年7月(1)
2024年4月(11)
2024年3月(13)
2024年2月(5)
2024年1月(10)
2023年12月(10)
2023年11月(12)
2023年10月(9)
2023年9月(9)
2023年8月(10)
2023年7月(8)
2023年6月(12)
2023年5月(10)
2023年4月(6)
2023年3月(13)
2023年2月(10)
2023年1月(2)
2022年12月(20)
2022年11月(18)
2022年10月(16)
2022年9月(15)
2022年8月(20)
2022年7月(14)
2022年6月(12)
阅读排行榜
1. OpenSSF安全计划:SBOM将驱动软件供应链安全(4223)
2. 通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测(3979)
3. 一文读懂配置管理(CM)(2380)
4. 21条最佳实践,全面保障 GitHub 使用安全(1886)
5. 渗透测试(PenTest)基础指南(1875)
评论排行榜
1. 应用管理平台Walrus开源,构建软件交付新范式(5)
2. 通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测(3)
3. GPUStack正式发布: 为大模型而生的开源GPU集群管理器(2)
4. Go应用性能优化的8个最佳实践,快速提升资源利用效率!(2)
5. 让 K8s 更简单!8款你不得不知的 AI 工具-Part 2(1)
推荐排行榜
1. 21条最佳实践,全面保障 GitHub 使用安全(6)
2. 通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测(3)
3. 简化 Go 开发:使用强大的工具提高生产力(3)
4. 优化您的部署:Docker 镜像最佳实践(2)
5. 让 K8s 更简单!8款你不得不知的 AI 工具-Part 2(2)
最新评论
1. Re:GPUStack正式发布: 为大模型而生的开源GPU集群管理器
@everest33 用Ollama Library方式不需要科学s网,马上也会支持ModelScope魔搭社区。...
--Seal软件
2. Re:GPUStack正式发布: 为大模型而生的开源GPU集群管理器
模型部署需要科学s网才能成功吧?怎么在应用内配置科学s网代理呢?
--everest33
3. Re:让 K8s 更简单!8款你不得不知的 AI 工具-Part 2
好家伙,AI直接执行运维操作,我看哪个公司的运维敢用。
出个错搞不好直接就是删库跑路
--冷芋头
4. Re:通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测
@星小梦 3.5也很优秀了~...
--Seal软件
5. Re:通义千问, 文心一言, ChatGLM, GPT-4, Llama2, DevOps 能力评测
@落叶子 至少从我的体验来看,千问和文心根本没法理解我的意思,想体验gpt4但是没办法访问。。。太难了。...
--星小梦
点击右上角即可分享