deephub

2025年7月27日

摘要：检索增强生成（Retrieval-Augmented Generation, RAG）是当前AI工程师在实际应用中面临的重要技术挑战之一。从理论角度来看，RAG的工作原理相对直观：从自定义数据源中检索相关上下文，然后基于这些上下文让大语言模型生成对应的回答。在实际部署过程中，开发者往往需要处理大量阅读全文

posted @ 2025-07-27 19:03 deephub 阅读(29) 评论(0) 推荐(0)

2025年7月26日

AI代理性能提升实战：LangChain+LangGraph内存管理与上下文优化完整指南

摘要：在AI代理系统的开发过程中，上下文工程已成为决定系统性能的关键技术。上下文工程本质上是在为AI系统分配任务之前建立合适的执行环境，这个环境需要包含明确的行为指令（如配置AI充当专业的预算旅行顾问）、来自数据库、文档或实时数据源的有用信息访问权限、对历史对话的记忆能力以避免信息重复或遗忘、可供AI调用阅读全文

posted @ 2025-07-26 18:49 deephub 阅读(77) 评论(0) 推荐(0)

2025年7月25日

2025年AI智能体开发完全指南：10个GitHub顶级教程资源助你从入门到精通

摘要：人工智能智能体（AI Agents）作为当前AI领域最具前沿性的技术方向，正在推动着自动化决策、多模态交互和复杂任务执行的革命性发展。本文精选了十个高质量的GitHub开源项目，涵盖从基础理论到实践应用的全方位学习路径，为AI开发者提供系统性的技术资源。 1、Hands-On Large Langu 阅读全文

posted @ 2025-07-25 16:59 deephub 阅读(72) 评论(0) 推荐(0)

2025年7月24日

DGMR压缩技术：让大规模视觉Transformer模型体积减半而性能不减

摘要： Transformer架构展现出卓越的扩展特性，其性能随模型容量增长而持续提升。大规模模型在获得优异性能的同时，也带来了显著的计算和存储开销。深入分析主流Transformer架构发现，多层感知器（MLP）模块占据了模型参数的主要部分，这为模型压缩提供了重要切入点。针对这一问题，研究者提出了多样性阅读全文

posted @ 2025-07-24 21:54 deephub 阅读(29) 评论(0) 推荐(0)

2025年7月23日

Google DeepMind发布MoR架构：50%参数超越传统Transformer，推理速度提升2倍

摘要：自2017年Vaswani等人发表"Attention Is All You Need"以来，Transformer架构已成为现代自然语言处理和人工智能系统的核心基础，为GPT、BERT、PaLM和Gemini等大型语言模型提供了强有力的技术支撑。然而，随着模型规模的不断扩大和任务复杂性的持续增长，阅读全文

posted @ 2025-07-23 19:16 deephub 阅读(103) 评论(0) 推荐(0)

2025年7月22日

从零构建智能对话助手：LangGraph + ReAct 实现具备记忆功能的 AI 智能体

摘要：随着人工智能技术的快速发展，构建能够自主推理和执行复杂任务的智能体系统已成为当前研究的热点。ReAct（Reasoning + Action）智能体作为一种突破性的架构模式，成功地将语言模型的推理能力与外部工具的行动能力有机结合，为解决复杂的现实世界问题提供了新的技术路径。在传统的语言模型应用中，阅读全文

posted @ 2025-07-22 19:40 deephub 阅读(70) 评论(0) 推荐(0)

2025年7月21日

最大熵逆强化学习：理论基础、数学推导与工程实现

摘要：模仿学习（Imitation Learning, IL）旨在从给定的专家演示数据中提取决策策略。该方法适用于各类自动化任务，尤其在控制领域应用广泛。本文重点讨论逆强化学习（Inverse Reinforcement Learning, IRL），这是模仿学习的重要分支，其核心目标是基于演示数据学习能阅读全文

posted @ 2025-07-21 19:43 deephub 阅读(42) 评论(0) 推荐(0)

2025年7月20日

从零搭建智能搜索代理：LangGraph + 实时搜索 + PDF导出完整项目实战

摘要：传统的AI聊天系统往往局限于预训练数据的知识范围，无法获取实时信息。本文将详细阐述如何构建一个基于LangGraph的智能代理系统，该系统能够智能判断何时需要进行网络搜索、有效维护对话上下文，并具备将对话内容导出为PDF文档的功能。本系统的核心特性包括：基于智能判断机制的自动网络搜索触发、跨多轮对阅读全文

posted @ 2025-07-20 18:26 deephub 阅读(49) 评论(0) 推荐(0)

2025年7月19日

GQNN框架：让Python开发者轻松构建量子神经网络

摘要：随着人工智能技术的快速发展，其计算复杂性需求也在不断提升。传统的经典神经网络在图像识别、自然语言处理等领域取得了显著成就，然而在处理指数级规模数据集或高度纠缠的复杂问题空间时，受限于经典计算的本质局限性，其性能增长逐渐趋于瓶颈。量子神经网络（Quantum Neural Networks, QNNs 阅读全文

posted @ 2025-07-19 21:15 deephub 阅读(50) 评论(0) 推荐(0)

2025年7月18日

差分隐私机器学习：通过添加噪声让模型更安全，也更智能

摘要：在敏感数据训练的机器学习模型中，个人信息通过推理攻击泄露的风险日益凸显。本文探讨如何在模型训练过程中平衡实用性与形式化隐私保证这一关键问题。我们采用带有噪声梯度更新的模拟DP-SGD算法实现差分隐私机器学习。实验结果表明，该模型在保持71%准确率和0.79 AUC的同时，展现出良好的泛化能力，但在少阅读全文

posted @ 2025-07-18 20:27 deephub 阅读(29) 评论(0) 推荐(0)

overfit深度学习

公告