慢思考的本质依然是通过生成更多的显性 Token 来换取计算时间。为了想得深,必须说得多。这一章的四篇论文都在尝试:能否在不输出废话的情况下,让模型在内部“空转”思考? 甚至打破自回归全局规划? ...
通义深度搜索Deep Research领域的核心技术突破与落地,结合多种专业模型和工具完成复杂问题拆解、分析、规划、结合预期格式与模板,以图文并茂方式创作生成最终调研报告。 ...
零售业的AI变革十字路口全球零售业正伫立于一个由人工智能(AI)、宏观经济不确定性与消费者行为结构性转变共同驱动的转型期。这并非简单的周期性波动,而是一场根本性的范式转移,其核心体现为两种截然不同的进化路径:成熟的全球市场正致力于优化现有商业模式以应对外部宏观经济的逆风,而高速迭代的中国市场则在内部 ...
在大模型落地场景中,本地轻量化部署因低延迟、高隐私性、无需依赖云端算力等优势,成为开发者与 AI 爱好者的热门需求。本文聚焦 Windows 10/11(64 位)环境,详细拆解 llama.cpp 工具的编译流程(支持 CPU/GPU 双模式,GPU 加速需依赖 NVIDIA CUDA),并指导如... ...
基于GEM的需求评审专家agent 之前有文章AI辅助需求规格描述评审,优化需求评审流程论LLM与人工审查协同模式。 以下是我们基于Google Gem,目前支持上传附件,如我们项目与产品需求文档直接上传评审。需求功能列表补全从这访问gemini.google.com今天先到这儿,希望对AI,云原生 ...
目录为什么选择 Dify + OllamaOllama 本地部署Dify 本地容器化部署模型接入与知识库 RAG 构建准备 Embedding 模型在 Dify 中添加 Ollama 模型供应商构建知识库检索测试构建智能体应用创建应用编排界面概览查询预处理关联知识库编写提示词调整模型参数调试与发布P ...
玩 Gemini 3.0 时,很多人都有个困惑:明明用的是同一个模型,别人生成的代码又快又准,自己却要反复调整提示词?其实关键藏在官方系统提示词里 —— 谷歌没明说,但这套 “隐藏规则” 直接决定了模型的响应逻辑。2026 年实测发现,掌握官方提示词的核心框架,再结合 PoloAPI(官网 polo ...
“用 Opus 4.5 写日常 CRUD 代码,就像请建筑大师贴瓷砖 —— 算力严重溢出,还得为过剩能力买单。”2026 年,开发者的核心竞争力已从 “能用顶级 AI” 转向 “会用对 AI”。Anthropic 的 Claude 系列(Opus 4.5、Sonnet 4.5、Haiku 3.5)针 ...
随着 Google DeepMind Gemini 3 系列(含 Gemini 3、3 Flash、3 Pro)的正式落地,其在长上下文理解、复杂指令执行、多模态一致性及工具调用稳定性上的跨越式升级,让这款模型成为支撑生产级系统的核心选择。但对国内开发者而言,官方直连的诸多壁垒让先进技术 “看得见、 ...
一.战略挑战:当前数据工作流程的瓶颈与高昂成本数据是驱动现代企业分析、决策与创新的核心引擎,而数据管道正是确保数据在企业内部高效、可靠流动的关键基础设施。然而,我们当前依赖手动配置和维护的数据工作流程,正面临着日益严峻的效率瓶颈和成本压力,这已成为制约我们业务敏捷性和增长潜力的战略性障碍。基于对行业 ...
临近年底,AI 编程工具的使用需求迎来爆发式增长,不少开发者却陷入了同一个困境 ——Claude 官方直连 API Key “一 key 难求”。打开 Anthropic 官方控制台,常见 “配额已售罄”“新密钥申请需排队 1-2 周” 的提示;即便老用户申请追加额度,也常因官方服务器负载调整、年底 ...
相比于未优化的 vLLM 基线,经过针对性调优的 DeepSeek-V3.2 在 NVIDIA H200 集群上实现了 57.8% 至 153.6% 的吞吐量提升。 ...
基于不止于代码-如何用 Trae IDE与Agent重塑软件需求工程 在 AI 编程工具爆发的今天,大多数人的目光仍聚焦在 Copilot 的代码补全上。但作为资深开发者,我们都清楚一个残酷的现实:如果需求(PRD)本身就是垃圾,写代码的速度越快,产出“技术债务”的速度就越快。最近,AI 辅助开发的 ...
AIOps 实战:如何用 Trae 智能体与边缘小模型 (SLM) 重构日志分析工作流摘要: 从 180MB 的日志文件中秒级定位故障,到 K8s 集群的全面体检——本文将揭秘如何构建“日志分析专家”Agent,并探讨“边缘清洗 + 云端推理”的下一代运维架构。 在运维(Ops)和开发(Dev)的日 ...
一个无法回避的十字路口我们正处在一场技术变革的中心,而这场变革“可能和我们经历过的任何一次技术变革都完全不同”。它不只是提升效率,而是从根本上挑战我们对人类价值和生存意义的定义,将我们直接推到了一个时代性的十字路口。本次辩论的核心问题因此变得无比清晰:人工智能究竟是把我们从繁琐、危险、重复的劳动中解 ...
2025年度技术BLOG总结与洞察整体数据概览发文统计年度总发文量:196篇(月均16.3篇)最高产月份:11月(33篇)、7月(26篇)、10月(23篇)最低产月份:1月(11篇)、4月(5篇)、3月(8篇)发文稳定性:全年保持持续输出,无明显断档,展现极强创作韧性影响力数据总阅读量估算:约3.2 ...
一.RAG系统评估的必要性与挑战检索增强生成(Retrieval-Augmented Generation, RAG)技术已成为增强大型语言模型(LLM)能力的关键范式。通过从外部知识库中检索相关信息,RAG能够有效解决LLM固有的知识过时和内容幻觉等核心局限性。无论是为客户支持系统提供最新的产品信 ...
智能行程规划工具2.0 一. 网页初尝试 一开始通过HTML写,发现调用智能体的api密钥只能明文保存,通过加密读取存在问题, 也不会用魔搭社区的py语法读取保存密钥。 二. 前后端连接 了解和尝试使用后端,在豆包的帮助下,成功跑通本地电脑和云服务器,用其他云服务器尝试也可以和后端连上。 尝试部署到 ...
AI-Rime 基于Rime的lua脚本系统打造AI增强输入法 Rime AI 纠错 v1 智能纠错 功能说明 极简版 AI 纠错功能: 按 6 触发纠错,显示"AI纠正中..." 再按 6 显示纠正结果 文件清单 文件 说明 ai_corrector_processor.lua 按键监听(放入 l ...
从“氛围编程”到“智能评审”——利用上下文感知 Agent 实现 30%+ 的研发左移提效在 AI 编程工具爆发的今天,大多数人的目光仍聚焦在 Copilot 的代码补全上。但作为资深开发者,我们都清楚一个残酷的现实:如果需求(PRD)本身就是垃圾,写代码的速度越快,产出“技术债务”的速度就越快。最 ...