会员
周边
新闻
博问
闪存
众包
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
2026年3月19日
理解 Agent 记忆:从无状态模型到持久化记忆架构
摘要: 大语言模型从根本上是无状态的。发送一条消息产生一个回复,每次新对话都是一块白板。 这事因为模型本身就是一个巨型函数:输入进去,token 出来,模型权重中没有任何持久化存储能在会话之间保留对话历史。 简单聊天机器人不在乎这一点。让它写一封求职信,写完就结束不需要连续性。 Agent 面对的情况截然不
阅读全文
posted @ 2026-03-19 20:35 deephub
阅读(0)
评论(0)
推荐(0)
2026年3月18日
CRAG 架构解析:如何在生成器前修正错误检索结果
摘要: 绝大多数 RAG 系统把检索当作不会出错的环节,无论拿到的文档是否真正切题,都会径直送入生成器。 "CRAG 提出了标准 RAG 从未追问的问题:如果检索器出错了,该怎么办?" "不加甄别地引入检索文档,无论其是否相关,都会主动误导生成器,让 RAG 的表现甚至不如不做检索。 CRAG 详解 CRA
阅读全文
posted @ 2026-03-18 21:40 deephub
阅读(2)
评论(0)
推荐(0)
2026年3月17日
高级 RAG 技术:查询转换与查询分解
摘要: 检索增强生成(RAG)的基础流程是用户查询转换为向量嵌入,从向量数据库中取回相似文档,再将这些文档作为上下文送入大语言模型(LLM)生成答案。 基础 RAG 的准确性受制于查询质量,查询模糊、表述不当,或者用户对问题的抽象层次把握不准,检索结果就会出偏差,LLM 拿到的上下文也跟着失真。垃圾输入,垃
阅读全文
posted @ 2026-03-17 22:37 deephub
阅读(1)
评论(0)
推荐(0)
2026年3月16日
构建生产级 AI Agent 系统的4大主流技术:反思、工具、规划与多智能体协作
摘要: 多数人对AI Agent的理解还停留在"聊天机器人的升级版",这个思路在一段时间里这么理解其实也没什问题,比如问一个问题,拿到一个回答。但很快就能看出来单轮提示-响应的交互根本没有任何的意义,而真正有意义的跃迁发生在AI开始具备这些能力的时候:思考、规划、行动、观察、循环往复,这和我们处理复杂问题的
阅读全文
posted @ 2026-03-16 21:22 deephub
阅读(4)
评论(0)
推荐(0)
2026年3月15日
BookRAG:面向层级文档的树-图融合RAG框架
摘要: 现有的RAG系统,无论是基于文本的图方法还是基于版面分割的方法,在面对这类文档时往往失效。根源在于两点:结构与语义的脱节以及工作流程的僵化。 本文介绍的BookRAG或许能提供一个有用的视角。 两种传统方法及其局限 处理这类文档有两种主流范式。 第一种是文本优先方法,将所有内容扁平化为纯文本,主要依
阅读全文
posted @ 2026-03-15 20:35 deephub
阅读(4)
评论(0)
推荐(0)
2026年3月14日
多智能体系统的三种编排模式:Supervisor、Pipeline 与 Swarm
摘要: 多智能体系统是 2026 年主流构建方式,Claude 的智能体团队功能、OpenAI 的 Swarm 框架、LangGraph 的编排层以及 CrewAI都指向同一个结论:复杂任务需要协调配合的专家,而非一个万能通才。 为什么单个智能体会失效 一个智能体包揽一切,就像一人创业公司——小规模时凑合,
阅读全文
posted @ 2026-03-14 22:00 deephub
阅读(6)
评论(0)
推荐(0)
2026年3月13日
更大的上下文窗口为什么让RAG变得更重要而非更多余
摘要: 一旦模型能读完所有内容检索增强生成(RAG)就没有存在的必要了,开发者只需要把整个代码库或者多年的聊天记录塞进 prompt,让模型自行处理,所以AI行业花了好几年追逐更大的上下文窗口:4K → 32K → 128K → 1M tokens。 但是真正在生产环境里这么做的时候就出了问题,因为答案变差
阅读全文
posted @ 2026-03-13 22:00 deephub
阅读(3)
评论(0)
推荐(0)
2026年3月12日
LangGraph vs Semantic Kernel:状态图与内核插件的两条技术路线对比
摘要: 多数关于 LangGraph 和 Semantic Kernel 的比较文章已经过时。过去六个月里,两个框架分别进行了重大的更新,所以本文将梳理的是实际发生的变化、当前的代码形态,以及如何进行技术选型。 2026 年构建 Python AI Agent 的现实状况是:都足够成熟的可选框架有两个,多数
阅读全文
posted @ 2026-03-12 21:30 deephub
阅读(3)
评论(0)
推荐(0)
2026年3月11日
基于网格搜索与分段回归的时间序列变化点检测方法
摘要: 传统统计方法在时间序列分析中既简洁又有力,但面对大规模时间序列集合时,扩展性往往不尽如人意。现实中的趋势变化往往微弱、带有噪声、数量也不止一个,靠肉眼判断既不可靠也不现实。一旦需要处理数十乃至数百条时间序列,人工识别就更不可行了。Figure 1: Identify the optimal numb
阅读全文
posted @ 2026-03-11 21:07 deephub
阅读(2)
评论(0)
推荐(0)
2026年3月10日
Python标准库里藏着的7个代码简化利器
摘要: 多数开发者通过教程学Python,教程教的是语法——循环、类、字典。但有经验的Python工程师依赖一套完全不同的工具:惰性求值、描述符、动态类创建、函数式管道。 这些不是入门技巧,是架构层面的武器。 开始使用它们之后,项目体积缩小了,维护成本降低了,自动化也顺畅得多。以下是改变一切的七个技巧。 h
阅读全文
posted @ 2026-03-10 20:51 deephub
阅读(2)
评论(0)
推荐(0)
下一页
公告