摘要:
通过 AI 网关将 Dify 的高效编排能力与专业 RAG 引擎的检索效能结合,企业可在保留现有 Dify 应用资产的同时,有效规避其内置 RAG 的局限,显著提升知识驱动型 AI 应用的生产环境表现。 阅读全文
posted @ 2025-08-29 14:00
阿里云云原生
阅读(339)
评论(0)
推荐(0)
摘要:
任务调度系统负责管理这些短周期的任务,通过用户设置的调度时间,周期性的把任务分发给执行器执行。每次任务要分发给哪个执行器执行,就是由路由策略决定的。 阅读全文
posted @ 2025-08-28 18:19
阿里云云原生
阅读(64)
评论(0)
推荐(0)
摘要:
近期,1688 推出了 1688 AI App,这貌似是国内第一个电商领域的独立 AI App 应用(若不是,欢迎评论指正)。本文试图通过产品界面这一入口,窥探其背后的系统工程。(笔者并非就职于 1688 团队,仅从一位 1688 普通用户的视角做些体验评测)。 阅读全文
posted @ 2025-08-28 17:41
阿里云云原生
阅读(238)
评论(0)
推荐(0)
摘要:
如今各个行业发展都十分迅猛,系统架构的设计越来越复杂,系统所承接的流量经常是变化多样、并且难以预测。 阅读全文
posted @ 2025-08-28 11:49
阿里云云原生
阅读(56)
评论(0)
推荐(0)
摘要:
编写的提示词运行在大语言模型上,所以我们是通过提示词对大语言模型进行编程,编程出来的应用我们叫做 AI 的原生应用。这种转变使我们对开发范式和应用开发的理解有非常多的思维转变。 阅读全文
posted @ 2025-08-27 18:16
阿里云云原生
阅读(341)
评论(0)
推荐(0)
摘要:
阿里云诚挚邀请您参加【AI 原生,智构未来——AI 原生架构与企业实践】工作坊,从开发范式到工程化实践,全链路解析AI原生架构奥秘,与AI先行者共探增长新机遇。 点击链接立即报名: https://hd.aliyun.com/form/6638 活动时间:8月29日 13:30 活动地点:深圳·La 阅读全文
posted @ 2025-08-26 17:46
阿里云云原生
阅读(21)
评论(0)
推荐(0)
摘要:
本文会介绍 Higress AI 网关提供的三种负载均衡算法:全局最小请求数负载均衡、前缀匹配负载均衡、GPU 感知负载均衡。 阅读全文
posted @ 2025-08-26 17:33
阿里云云原生
阅读(102)
评论(0)
推荐(0)
摘要:
持续性能剖析技术是一种通过采集应用相关线程在申请相关资源时的方法栈状态信息,再通过火焰图等可视化技术绘制出对应资源使用分布情况,最后,确定相关时段特定资源波动根因的一种强有力技术。 阅读全文
posted @ 2025-08-26 16:43
阿里云云原生
阅读(53)
评论(0)
推荐(0)
摘要:
针对 Dify 性能问题,本文将介绍如何使用 Higress AI 网关保证 Dify 应用的全链路高可用性,并给出操作实践指南。 阅读全文
posted @ 2025-08-25 16:44
阿里云云原生
阅读(414)
评论(0)
推荐(0)
摘要:
本文将通过分析其在技术上的不同和若干用例,进一步挖掘 Macaron AI 的产品价值。 阅读全文
posted @ 2025-08-25 16:13
阿里云云原生
阅读(241)
评论(0)
推荐(0)
浙公网安备 33010602011771号