[AI/GPT] 硅基流动(SiliconFlow) : AI大模型时代的基础设施(Model API as Service)
目录
序
- Ollama / SilliconFlow / GPT厂商的【API】 + AI终端应用软件,即可搭建个人、家庭、企业的私有智能体。
Ollama vs SilliconFlow vs GPT 厂商
- Ollama : 私有化部署大模型、并对外提供大模型API的免费开源工具。
- 可支持接入多种大模型。
- 可支持 Windows / Linux / Mac 等操作系统
- 若最终需对外多人开放,则还需自己解决域名、公有IP、服务器、安全和运维等事项。
若仅仅是自己个人、或家庭/企业内网使用,则无需考虑此问题。
模型广场:可自主寻找需要的模型 | https://ollama.com/search
无用户界面,仅提供基础的CLI端 和 Web API
- SilliconFlow(硅基流动) : 公有化部署大模型、对外提供大模型API的付费、商业化工具
- 接入了多种大模型
- 由平台负责统一域名、公有IP、服务器、安全和运维等基础事项,由平台面向用户直接提供多种大模型和模型的API。
- 与 Ollama 的几个不同之处:
- 1、免去了自己部署的安全与运维工作(域名/公有IP/服务器/安全/...)
- 2、间接牺牲了一定的自主性
- 3、间接牺牲了一定的用户隐私
- 拉新的活动期:
- a,目前注册即送用户 14元 价值 (2000W token) 的使用额度
- b,每帮助平台新增一个用户,也将赠送发起邀请的用户14元
- c,对话成本问题。自测情况,简单的文本对话,单次消耗在 2000 token 内(约 0.03 元),那么 14元 即可使用文本对话 466 次。
- GPT 厂商:OpenAI(ChatGPT) | 通义/Qwen(阿里巴巴) | DeepSeek(深度求索/幻方量化) | 讯飞星火 | 豆包 | ...
- 一般仅会支持自家的大模型,少部分厂商会支持开源版 DeepSeek V3/R1
AI 终端应用软件
-
终端应用软件的形态: APP,Web 网站,PC 软件,嵌入式软件等
-
情况1:GPT 大模型厂商自家的APP 或网站 (免费或部分功能付费,较为常见)
-
情况2:部分互联网厂商聚合、代理部署,并提供APP,网站和API
- 360 纳米AI
- ...
- 情况3:开源的AI终端软件工具
接入 Ollama API / SilliconFlow API / 大模型厂商 API / ...
- ChatBox
- Cherry Studio
- ...
概述:硅基流动(SilliconFlow)
简介
🌸硅基流动(SiliconFlow) 是一家专注于人工智能(AI)基础设施的公司,致力于通过技术创新降低大模型(如生成式AI和大语言模型)的部署和推理成本,推动人工通用智能(AGI)的普及。
以下是关于硅基流动的详细介绍:
公司背景与使命
硅基流动成立于2023年8月,总部位于北京海淀区,由袁进辉博士创立。袁进辉是清华大学计算机系博士,曾在微软亚洲研究院任职,并创立了开源深度学习框架“一流科技(OneFlow)”。硅基流动的使命是通过提供高效、低成本的AI基础设施,降低大模型应用的技术门槛和成本,加速AGI技术的普及。
核心产品与服务
硅基流动的主要产品和服务包括:
🚢(1)SiliconCloud 大模型云服务平台
功能:提供一站式生成式AI(GenAI)服务,支持文本生成、图像生成、语音生成、视频生成等多模态任务。
特点:
集成多种主流开源大模型(如DeepSeek、Qwen2.5、Llama-3.X、Stable Diffusion等)。
提供低成本的API调用服务,部分小型模型(如9B以下)永久免费。
内置推理加速引擎(如SiliconLLM和OneDiff),显著提升模型响应速度和生成效率。
🚢(2)SiliconLLM 大语言模型推理引擎
功能:优化大语言模型的推理性能,支持国内外主流芯片部署。
特点:在超长上下文、低延迟等复杂场景中表现优异,推理速度提升最高可达10倍。
🚢(3)OneDiff 高性能文生图/视频加速库
功能:加速图像和视频生成任务。
特点:支持Stable Diffusion等模型,性能提升高达3倍,1秒内即可生成高质量图像。
🚢(4)SiliconBrain 一站式AI应用开发平台
功能:面向企业用户的私有化部署方案,支持模型微调与托管。
特点:基于DevOps原理,实现持续集成、持续交付和持续部署,帮助企业降低维护成本。
技术优势
高效能推理:通过自研的推理引擎和加速库,显著提升模型的计算效率。
低成本部署:提供行业内较低的API调用价格,并支持免费额度(如新用户注册可获得2000万Token免费额度)。
多模态支持:覆盖文本、语音、图像、视频等多种生成任务,满足多样化应用需求。
适用场景
硅基流动的产品和服务适用于以下场景:
企业级AI应用开发:通过低成本API服务,快速集成大模型到企业产品中。
个人开发者与AI爱好者:无需昂贵硬件支持,即可使用顶尖大模型进行实验和创新。
多模态内容生成:支持文本、语音、图像和视频生成,适用于内容创作者和设计师。
模型微调与定制:企业可上传自有数据,对模型进行微调,满足特定业务需求。
商业化与融资
硅基流动自成立以来,已获得多轮融资:
2024年1月,完成5000万元天使轮融资,由创新工场、奇绩创坛等机构投资。
2024年7月,完成近亿元天使+轮融资,由某知名产业方领投。
公司还与国内外多家大客户建立战略合作伙伴关系,并积累了多家海外付费客户。
未来展望
硅基流动致力于成为AI基础设施领域的领军企业,通过不断优化技术和服务,降低大模型应用成本,推动AGI技术的普及和发展。
使用指南
注册/登录
- url
邀请码:djWvMoJw
邀请链接:https://cloud.siliconflow.cn/i/djWvMoJw
- 登录后默认进入:模型广场
模型
模型广场
- url
模型微调
体验中心
文本对话
图像生成
视频生成
语音生成
账户管理
实名认证
API密钥
等级包
余额充值
费用账单
文档中心
- url
应用场景
ChatBox 应用终端APP中集成 SiiliconCloud API
-
在
ChatBox
中配置API连接: -
下载并安装最新版的ChatBox(支持Win/Mac/Linux/APP端)
Android APP 也支持
-
打开
ChatBox
,点击界面左下角的“Setting”,选择“Model provider”为“SiliconFlow API” -
填写之前复制的API密钥,选择合适的模型(如DeepSeek-V3或DeepSeek-R1)
- 使用效果验证:
- 在
ChatBox
对话界面左上角选择已配置的对话框进行提问,验证API的使用效果
Y 推荐资源
- SiliconFlow
X 参考文献
- 无

本文链接: https://www.cnblogs.com/johnnyzen/p/18714654
关于博文:评论和私信会在第一时间回复,或直接私信我。
版权声明:本博客所有文章除特别声明外,均采用 BY-NC-SA 许可协议。转载请注明出处!
日常交流:大数据与软件开发-QQ交流群: 774386015 【入群二维码】参见左下角。您的支持、鼓励是博主技术写作的重要动力!
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· DeepSeek “源神”启动!「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· 上周热点回顾(2.17-2.23)
· 如何使用 Uni-app 实现视频聊天(源码,支持安卓、iOS)
· 微软正式发布.NET 10 Preview 1:开启下一代开发框架新篇章