会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
26
27
28
29
30
31
32
33
34
···
154
下一页
2025年6月2日
BayesFlow:基于神经网络的摊销贝叶斯推断框架
摘要: 贝叶斯推断为不确定性条件下的推理、复杂系统建模以及基于观测数据的预测提供了严谨且功能强大的理论框架。尽管贝叶斯建模在理论上具有优雅性,但在实际应用中经常面临显著的计算挑战:后验分布通常缺乏解析解,模型验证和比较需要进行重复的推断计算,基于仿真的工作流程(如校准、参数恢复、敏感性分析)的计算复杂度极高
阅读全文
posted @ 2025-06-02 16:14 deephub
阅读(34)
评论(0)
推荐(0)
2025年6月1日
基于内存高效算法的 LLM Token 优化:一个有效降低 API 成本的技术方案
摘要: 在使用 OpenAI、Claude、Gemini 等大语言模型 API 构建对话系统时,开发者普遍面临成本不断上升的挑战。无论是基于检索增强生成(RAG)的应用还是独立的对话系统,这些系统都需要维护对话历史以确保上下文的连贯性,类似于 ChatGPT 对历史对话的记忆机制。 这种历史记忆机制虽然提升
阅读全文
posted @ 2025-06-01 19:15 deephub
阅读(62)
评论(0)
推荐(0)
2025年5月31日
基于图神经网络的自然语言处理:融合LangGraph与大型概念模型的情感分析实践
摘要: 在企业数字化转型进程中,非结构化文本数据的处理与分析已成为核心技术挑战。传统自然语言处理方法在处理客户反馈、社交媒体内容和内部文档等复杂数据集时,往往难以有效捕获文本间的深层语义关联和结构化关系。大型概念模型(Large Concept Models, LCMs)与图神经网络的融合为这一挑战提供了创
阅读全文
posted @ 2025-05-31 17:35 deephub
阅读(57)
评论(0)
推荐(0)
2025年5月30日
为什么混合专家模型(MoE)如此高效:从架构原理到技术实现全解析
摘要: 在人工智能技术快速演进的背景下,大型语言模型的架构设计始终围绕仅解码器(decoder-only)的Transformer结构展开。自第一个GPT模型发布以来,该架构已成为主流设计范式。尽管研究人员在效率优化方面进行了诸多改进,但核心架构结构保持相对稳定。 近期大型语言模型的发展呈现出一个重要的架构
阅读全文
posted @ 2025-05-30 09:55 deephub
阅读(160)
评论(0)
推荐(0)
2025年5月29日
Jupyter MCP服务器部署实战:AI模型与Python环境无缝集成教程
摘要: Jupyter MCP 服务器是基于模型上下文协议(Model Context Protocol, MCP)的 Jupyter 环境扩展组件,它能够实现大型语言模型与实时编码会话的无缝集成。该服务器通过标准化的协议接口,使 AI 模型能够安全地访问和操作 Jupyter 的核心组件,包括内核管理、文
阅读全文
posted @ 2025-05-29 15:49 deephub
阅读(62)
评论(0)
推荐(0)
2025年5月28日
图神经网络在信息检索重排序中的应用:原理、架构与Python代码解析
摘要: 现代信息检索系统和搜索引擎普遍采用两阶段检索架构,在人工智能应用中也被称为检索增强生成(Retrieval-Augmented Generation, RAG)。在初始检索阶段,系统采用高效的检索方法,包括词汇检索算法(如BM25)或密集嵌入检索器(基于近似最近邻算法),为给定查询获取初始候选文档或
阅读全文
posted @ 2025-05-28 14:10 deephub
阅读(41)
评论(0)
推荐(0)
2025年5月27日
CUDA更新:原生Python可直接编写高性能GPU程序
摘要: NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将消除Python开发者进入GPU加速计算领域的主要技术壁垒,无需再依赖C/C++语言作为中介。 此次更新意味着数千万Python开发者现在可以直接使用熟悉的语言
阅读全文
posted @ 2025-05-27 10:03 deephub
阅读(30)
评论(0)
推荐(0)
CUDA重大更新:原生Python可直接编写高性能GPU程序
摘要: NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新:CUDA并行计算平台正式支持原生Python编程。这一突破性进展将消除Python开发者进入GPU加速计算领域的主要技术壁垒,无需再依赖C/C++语言作为中介。 此次更新意味着数千万Python开发者现在可以直接使用熟悉的语言
阅读全文
posted @ 2025-05-27 09:49 deephub
阅读(33)
评论(0)
推荐(0)
2025年5月26日
多模态RAG实战指南:完整Python代码实现AI同时理解图片、表格和文本
摘要: 传统RAG系统在处理纯文本应用场景中已展现出显著效果,然而现实世界的信息载体往往呈现多模态特征。文档中普遍包含图像、表格、图表等承载关键信息的视觉元素,这些多模态内容的有效处理正是多模态RAG系统的核心价值所在。 多模态RAG最优方案选择 经过系统性研究和实验验证,我们将介绍一个在RAG系统中处理多
阅读全文
posted @ 2025-05-26 13:29 deephub
阅读(86)
评论(0)
推荐(0)
2025年5月25日
Python实现时间序列动量策略:波动率标准化让量化交易收益更平稳
摘要: 时间序列动量策略(Time-Series Momentum, TSMOM)作为量化交易领域中最为持久且被深入研究的策略类型之一,其核心理念相对简明:对于显示上升趋势的资产建立多头头寸,对于呈现下降趋势的资产建立空头头寸。尽管历史数据表明此类策略具有盈利性,但传统TSMOM策略存在一个显著缺陷:风险敞
阅读全文
posted @ 2025-05-25 11:12 deephub
阅读(132)
评论(0)
推荐(0)
上一页
1
···
26
27
28
29
30
31
32
33
34
···
154
下一页
公告