会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
27
28
29
30
31
32
33
34
35
···
151
下一页
2025年4月28日
NoProp:无需反向传播,基于去噪原理的非全局梯度传播神经网络训练,可大幅降低内存消耗
摘要: 反向传播算法自四十年前问世以来一直作为深度学习的基石,然而仍然面临两项关键技术挑战:首先由于必须存储中间激活值用于梯度计算,导致内存消耗显著;其次其本质上的顺序计算特性严重限制了模型在分布式多GPU环境下的并行扩展能力。近期牛津大学、Mila研究所与Google DeepMind的研究团队联合提出了
阅读全文
posted @ 2025-04-28 10:05 deephub
阅读(75)
评论(0)
推荐(0)
2025年4月27日
GenPRM:思维链+代码验证,通过生成式推理的过程奖励让大模型推理准确率显著提升
摘要: 过程奖励模型(PRMs)作为验证机制在提升大型语言模型(LLMs)性能方面展现出显著潜力。而当前PRMs框架面临三个核心技术挑战:过程监督和泛化能力受限、未充分利用LLM生成能力而仅依赖标量值预测,以及在测试时计算无法有效扩展。 针对上述局限,这篇论文提出了GenPRM,一种创新性的生成式过程奖励模
阅读全文
posted @ 2025-04-27 10:21 deephub
阅读(56)
评论(0)
推荐(0)
2025年4月26日
PyTabKit:比sklearn更强大的表格数据机器学习框架
摘要: 长期以来Scikit-Learn 一直作为表格数据机器学习的主流框架,它提供了丰富的算法、预处理工具和模型评估功能。尽管 Scikit-Learn 功能完备,但随着技术的发展,新兴框架 PyTabKit 正逐渐崭露头角。该框架专为表格数据的分类和回归任务设计,集成了 RealMLP 等先进技术以及优
阅读全文
posted @ 2025-04-26 10:40 deephub
阅读(46)
评论(0)
推荐(0)
2025年4月25日
SecMulti-RAG:兼顾数据安全与智能检索的多源RAG框架,为企业构建不泄密的智能搜索引擎
摘要: 本文深入剖析SecMulti-RAG框架,该框架通过集成内部文档库、预构建专家知识以及受控外部大语言模型,并结合保密性过滤机制,为企业提供了一种平衡信息准确性、完整性与数据安全性的RAG解决方案,同时有效控制部署成本。 企业环境中AI助手的机遇与挑战 企业级AI助手的潜力正在迅速显现——一种能够无缝
阅读全文
posted @ 2025-04-25 16:47 deephub
阅读(38)
评论(0)
推荐(0)
2025年4月24日
KG4MM:融合知识图谱与多模态数据预测药物相互作用
摘要: 知识图谱(Knowledge Graph, KG)作为表示不同实体间复杂关系的有效工具,已得到广泛应用。通过将信息编码为节点(实体)和边(关系),知识图谱简化了关联信息的追踪与分析。用于多模态学习的知识图谱(Knowledge Graphs for Multimodal Learning, KG4M
阅读全文
posted @ 2025-04-24 13:50 deephub
阅读(66)
评论(0)
推荐(0)
2025年4月23日
CLIMB自举框架:基于语义聚类的迭代数据混合优化及其在LLM预训练中的应用
摘要: 尽管优化预训练数据混合对大型语言模型(LLM)的性能有显著影响,但确定最优数据配比仍然是一个亟待解决的挑战。为应对这一问题,英伟达提出了一种名为CLIMB(CLustering-based Iterative data Mixture Bootstrapping)的自动化框架,该框架能够在预训练环境
阅读全文
posted @ 2025-04-23 11:38 deephub
阅读(50)
评论(0)
推荐(0)
2025年4月22日
10招立竿见影的PyTorch性能优化技巧,让模型训练速度翻倍
摘要: PyTorch作为深度学习研究与工程领域的主流框架,拥有强大的性能潜力,但许多高级性能特性往往隐藏在文档深处,未被充分利用。本文基于对多种模型架构、不同PyTorch版本和容器环境的实证测试,系统总结了PyTorch性能调优的关键技术,旨在帮助开发者构建高效、可扩展的深度学习应用。 https://
阅读全文
posted @ 2025-04-22 10:42 deephub
阅读(118)
评论(0)
推荐(0)
2025年4月21日
SmolVLM:资源受限环境下的高效多模态模型研究
摘要: SmolVLM是专为资源受限设备设计的一系列小型高效多模态模型。尽管模型规模较小,但通过精心设计的架构和训练策略,SmolVLM在图像和视频处理任务上均表现出接近大型模型的性能水平,为实时、设备端应用提供了强大的视觉理解能力。 SmolVLM架构设计 该研究系统性地探索了小型多模态模型的设计选择与权
阅读全文
posted @ 2025-04-21 13:00 deephub
阅读(104)
评论(0)
推荐(0)
2025年4月20日
从零开始用Pytorch实现LLaMA 4的混合专家(MoE)模型
摘要: 近期发布的LLaMA 4模型引入了混合专家(Mixture of Experts, MoE)架构,旨在提升模型效率和性能。尽管社区对LLaMA 4的实际表现存在一些讨论,但MoE作为一种重要的模型设计范式,继Mistral等模型之后再次受到关注。所以我们将使用Pytorch逐步从零开始实现一个简化版
阅读全文
posted @ 2025-04-20 10:52 deephub
阅读(87)
评论(0)
推荐(0)
2025年4月19日
ReSearch:基于强化学习的大语言模型推理搜索框架
摘要: ReSearch是一种创新性框架,通过强化学习技术训练大语言模型执行"推理搜索",无需依赖推理步骤的监督数据。该方法将搜索操作视为推理链的有机组成部分,其中搜索的时机与方式由基于文本的推理过程决定,而搜索结果进一步引导后续推理。研究分析表明,ReSearch在强化学习训练过程中自然地形成了高级推理能
阅读全文
posted @ 2025-04-19 14:44 deephub
阅读(26)
评论(0)
推荐(0)
上一页
1
···
27
28
29
30
31
32
33
34
35
···
151
下一页
公告