上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 234 下一页

2025年2月20日

RAG框架,都在这了!

摘要: RAG 很多人都听说过,或者实践过,目前最直接的应用就是构建智能问答系统。 什么是 RAG? RAG 是 Retrieval Augmented Generation 的简写,翻译过来就是检索增强生成。 从名字就可以拆分出 RAG 的三大部分,检索、增强、生成,表面意思就是: 1、去知识库检索相关的 阅读全文

posted @ 2025-02-20 17:27 ExplorerMan 阅读(4871) 评论(0) 推荐(2)

FastRAG半结构化RAG实现思路及OpenAI O1-long COT蒸馏路线思考

摘要: 本文看两个问题,一个是最近模仿openaiAI O1现有路线-long COT蒸馏路线,有些有趣的点。 另一个是还是回归到RAG上,最近同名的RAG框架很多,例如fastRAG(https://github.com/IntelLabs/fastRAG.git,朴素rag的一个模块化)和FastRAG 阅读全文

posted @ 2025-02-20 17:18 ExplorerMan 阅读(110) 评论(0) 推荐(0)

技术笔记-LLM的格式化输出和工具调用

摘要: 调用外部工具是Agent区别于LLM的最重要区别之一。为了调用外部工具,需要做的主要有两件事: 针对用户输入的要求,从工具池中选择合适的工具,当然也可以选择不调用工具。这里考察的是LLM的reasoning的能力,一般来说,越大的模型效果越好。 对于选择的工具,要传入正确的参数(包括格式和内容)。这 阅读全文

posted @ 2025-02-20 17:01 ExplorerMan 阅读(385) 评论(0) 推荐(0)

RAG七十二式:2024年度RAG清单

摘要: RAG七十二式:2024年度RAG清单 转:https://mp.weixin.qq.com/s/Sy1dSx5RUtD6rjMY7_efkw ▍作者:范志东,蚂蚁图计算开源负责人、图计算布道师 回顾2024,大模型日新月异,智能体百家争鸣。作为AI应用的重要组成部分,RAG也是“群雄逐鹿,诸侯并起 阅读全文

posted @ 2025-02-20 16:32 ExplorerMan 阅读(236) 评论(0) 推荐(0)

DeepSeek最强专业拆解来了,清交复教授超硬核解读

摘要: https://mp.weixin.qq.com/s/LsMOIgQinPZBnsga0imcvA DeepSeek的写作能力为何飞跃?PTX是否真正做到了绕开CUDA的垄断?编辑 | ZeR0智东西2月3日报道,周日晚间,五位高校教授夜话DeepSeek,从模型方法、框架、系统、基础设施等角度,阐 阅读全文

posted @ 2025-02-20 15:25 ExplorerMan 阅读(151) 评论(0) 推荐(0)

万字解析DeepSeek MOE架构——从Switch Transformers到DeepSeek v1/v2/v3

摘要: 前文对基于DeepSeek v3 Base模型训练的deepseek-R1技术报告进行了解读,如有需求可阅读: 浮生梦晓:DeepSeek-R1: Incentivizing Reasoning Capability in LLMs via Reinforcement Learning——技术报告详 阅读全文

posted @ 2025-02-20 11:44 ExplorerMan 阅读(1219) 评论(0) 推荐(0)

2025年2月19日

大语言模型应用开发框架 —— Eino 正式开源!

摘要: 经过字节跳动内部半年多的使用和迭代,基于 Golang 的大模型应用综合开发框架 —— Eino,已在 CloudWeGo 正式开源啦! Eino 基于明确的“组件”定义,提供强大的流程“编排”,覆盖开发全流程,旨在帮助开发者以最快的速度实现最有深度的大模型应用。 你是否曾有这种感受:想要为自己的应 阅读全文

posted @ 2025-02-19 20:39 ExplorerMan 阅读(494) 评论(0) 推荐(0)

VisRAG:基于视觉的检索增强生成方法

摘要: 研究背景 研究问题:这篇文章要解决的问题是如何在多模态文档中利用视觉信息来增强大型语言模型(LLMs)的生成能力。传统的检索增强生成(RAG)系统仅基于文本,无法利用布局和图像等视觉信息,这在现实世界的多模态文档中非常重要。 研究难点:该问题的研究难点包括:如何在多模态文档中直接嵌入图像并使用视觉语 阅读全文

posted @ 2025-02-19 19:45 ExplorerMan 阅读(249) 评论(0) 推荐(0)

梳理2024年的RAG

摘要: 在已经过去的 2024 年,RAG 的发展可以称得上是风起云涌,我们回顾全年,从多个角度对全年的发展进行总结。首先用下图镇楼: 对于 2024 年的 RAG 来说,有一系列标志性事件: 关于 RAG 的争论——RAG 已死,RAG 永存 ! 2024 年在年初被称为“RAG 发展元年”,虽然这并非共 阅读全文

posted @ 2025-02-19 19:37 ExplorerMan 阅读(418) 评论(0) 推荐(1)

2025年2月18日

谷歌 DeepMind 推出 OPRO 技术,可优化 ChatGPT 提示

摘要: 据站长之家 11 月 21 日报道,在最新的 AI 研究报道中,Google DeepMind 推出了一项名为“优化通过提示(OPRO)”的技术,将大型语言模型(LLM)作为其自身提示的优化器。该方法旨在通过自然语言描述问题,指导 LLM 生成和改进解决方案,从而提高提示性能。 DeepMind 的 阅读全文

posted @ 2025-02-18 14:17 ExplorerMan 阅读(145) 评论(0) 推荐(0)

上一页 1 ··· 8 9 10 11 12 13 14 15 16 ··· 234 下一页

导航