会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
30
31
32
33
34
35
36
37
38
···
154
下一页
2025年4月20日
从零开始用Pytorch实现LLaMA 4的混合专家(MoE)模型
摘要: 近期发布的LLaMA 4模型引入了混合专家(Mixture of Experts, MoE)架构,旨在提升模型效率和性能。尽管社区对LLaMA 4的实际表现存在一些讨论,但MoE作为一种重要的模型设计范式,继Mistral等模型之后再次受到关注。所以我们将使用Pytorch逐步从零开始实现一个简化版
阅读全文
posted @ 2025-04-20 10:52 deephub
阅读(90)
评论(0)
推荐(0)
2025年4月19日
ReSearch:基于强化学习的大语言模型推理搜索框架
摘要: ReSearch是一种创新性框架,通过强化学习技术训练大语言模型执行"推理搜索",无需依赖推理步骤的监督数据。该方法将搜索操作视为推理链的有机组成部分,其中搜索的时机与方式由基于文本的推理过程决定,而搜索结果进一步引导后续推理。研究分析表明,ReSearch在强化学习训练过程中自然地形成了高级推理能
阅读全文
posted @ 2025-04-19 14:44 deephub
阅读(28)
评论(0)
推荐(0)
2025年4月18日
2025年GitHub平台上的十大开源MCP服务器汇总分析
摘要: 随着人工智能生态系统的迅速演进,模型与工具之间的无缝通信已成为技术发展的关键环节。在这一背景下,模型上下文协议(Model Context Protocol,MCP)服务器正日益凸显其战略价值。这些服务器作为连接AI与现实世界的技术桥梁,实现了人工智能模型与现实应用程序、API接口、数据库及自动化工
阅读全文
posted @ 2025-04-18 09:50 deephub
阅读(237)
评论(0)
推荐(0)
2025年4月17日
Crawl4AI:为大语言模型打造的开源网页数据采集工具
摘要: 随着大型语言模型(LLMs)的快速发展,高质量数据供给已成为智能系统的关键基础架构。为使人工智能系统能够生成有实际价值的分析结果,它需要获取及时、结构化且相关性高的数据源。如Crawl4AI这类工具正在革新数据获取与传递机制,使大语言模型能够动态接入多样化数据源,而无需受限于固定API接口的约束。
阅读全文
posted @ 2025-04-17 09:54 deephub
阅读(97)
评论(0)
推荐(0)
2025年4月16日
Triton入门教程:安装与编写和运行简单Triton内核
摘要: Triton是一款开源的GPU编程语言与编译器,为AI和深度学习领域提供了高性能GPU代码的高效开发途径。本指南将全面阐述Triton的核心功能、跨平台安装方法、基础应用实例、高级性能优化策略、与CUDA及PyTorch的技术对比,以及在实际项目中的应用场景。 技术定位与优势分析 Triton的设计
阅读全文
posted @ 2025-04-16 10:01 deephub
阅读(231)
评论(0)
推荐(0)
2025年4月15日
用离散标记重塑人体姿态:VQ-VAE实现关键点组合关系编码
摘要: 在人体姿态估计领域,传统方法通常将关键点作为基本处理单元,这些关键点在人体骨架结构上代表关节位置(如肘部、膝盖和头部)的空间坐标。现有模型对这些关键点的预测主要采用两种范式:直接通过坐标回归或间接通过热图(heat map,即图像空间中的密集概率分布)进行估计。尽管这些方法在实际应用中取得了显著效果
阅读全文
posted @ 2025-04-15 12:02 deephub
阅读(54)
评论(0)
推荐(0)
2025年4月14日
MCP与A2A协议比较:人工智能系统互联与协作的技术基础架构
摘要: 在人工智能领域的快速迭代发展中,两种协议已成为构建新一代AI系统的关键基础设施:模型上下文协议(Model Context Protocol,MCP)和代理对代理协议(Agent-to-Agent Protocol,A2A)。表面上这两种协议可能存在相似之处,但它们在设计目标和应用场景上有着明确区分
阅读全文
posted @ 2025-04-14 10:08 deephub
阅读(74)
评论(0)
推荐(0)
2025年4月13日
比扩散策略更高效的生成模型:流匹配的理论基础与Pytorch代码实现
摘要: 扩散模型(Diffusion Models)和流匹配(Flow Matching)是用于生成高质量、连贯性强的高分辨率数据(如图像和机器人轨迹)的先进技术。在图像生成领域,扩散模型的代表性应用是Stable Diffusion,该技术已成功迁移至机器人学领域,形成了所谓的"扩散策略"(Diffusi
阅读全文
posted @ 2025-04-13 10:06 deephub
阅读(816)
评论(0)
推荐(0)
2025年4月12日
从零实现基于扩散模型的文本到视频生成系统:技术详解与Pytorch代码实现
摘要: 本文详细介绍了基于扩散模型构建的文本到视频生成系统,展示了在MSRV-TT和Shutterstock视频标注数据集上训练的模型输出结果。以下是模型在不同提示词下的生成示例。首先展示一些模型生成效果展示 提示词:**"A person holding a camera"**(训练10K步) 拿相机的人
阅读全文
posted @ 2025-04-12 10:51 deephub
阅读(68)
评论(0)
推荐(0)
2025年4月11日
18个常用的强化学习算法整理:从基础方法到高级模型的理论技术与代码实现
摘要: 本文系统讲解从基本强化学习方法到高级技术(如PPO、A3C、PlaNet等)的实现原理与编码过程,旨在通过理论结合代码的方式,构建对强化学习算法的全面理解。 为确保内容易于理解和实践,全部代码均在Jupyter Notebook环境中实现,仅依赖基础库进行算法构建。 代码库组织结构如下: ├── 1
阅读全文
posted @ 2025-04-11 09:59 deephub
阅读(181)
评论(0)
推荐(0)
上一页
1
···
30
31
32
33
34
35
36
37
38
···
154
下一页
公告