会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
7
8
9
10
11
12
13
14
15
···
152
下一页
2025年11月23日
JAX 核心特性详解:纯函数、JIT 编译、自动微分等十大必知概念
摘要: JAX 是 Google 和 NVIDIA 联合开发的高性能数值计算库,这两年 JAX 生态快速发展,周边工具链也日益完善了。如果你用过 NumPy 或 PyTorch,但还没接触过 JAX,这篇文章能帮助你快速上手。 围绕 JAX 已经涌现出一批好用的库:Flax 用来搭神经网络,Optax 处理
阅读全文
posted @ 2025-11-23 19:43 deephub
阅读(17)
评论(0)
推荐(0)
2025年11月22日
高级检索增强生成系统:LongRAG、Self-RAG 和 GraphRAG 的实现与选择
摘要: 检索增强生成(RAG)早已不是简单的向量相似度匹配加 LLM 生成这一套路。LongRAG、Self-RAG 和 GraphRAG 代表了当下工程化的技术进展,它们各可以解决不同的实际问题。 传统 RAG 的核心限制 标准的 RAG 流程大概是这样的:把文档分割成小块、向量化、通过余弦相似度检索、喂
阅读全文
posted @ 2025-11-22 23:26 deephub
阅读(14)
评论(0)
推荐(0)
2025年11月21日
CrewAI 上手攻略:多 Agent 自动化处理复杂任务,让 AI 像员工一样分工协作
摘要: CrewAI是一个可以专门用来编排自主 AI 智能体(Autonomous AI Agents) 的Python 框架,你可以把它理解为在代码层面组建一个“虚拟团队”,给每个 Agent 分配特定的角色、目标,让它们协同处理那些单个 LLM 搞不定的复杂任务。 https://avoid.overf
阅读全文
posted @ 2025-11-21 19:49 deephub
阅读(18)
评论(0)
推荐(0)
2025年11月20日
PyTorch 分布式训练底层原理与 DDP 实战指南
摘要: 深度学习模型参数量和训练数据集的爆炸式增长,以 Llama 3.1 为例:4050 亿参数、15.6 万亿 token 的训练量,如果仅靠单 GPU可能需要数百年才能跑完,或者根本无法加载模型。 并行计算(Parallelism)通过将训练任务分发到多个 GPU(单机多卡或多机多卡),并利用通信原语
阅读全文
posted @ 2025-11-20 21:59 deephub
阅读(16)
评论(0)
推荐(0)
2025年11月19日
LEANN:一个极简的本地向量数据库
摘要: 在软件开发领域,提到轻量级、嵌入式的本地数据库,我们首先会想到 SQLite,它快速且无需独立服务进程。现在检索增强生成(RAG)和向量数据库的世界里,一个定位相似的新工具出现了。你可以把LEANN看作是嵌入式、轻量级的向量数据库。它完全不需要依赖庞大的数据中心或者 GPU 集群。一个个人专属的 R
阅读全文
posted @ 2025-11-19 21:22 deephub
阅读(26)
评论(0)
推荐(0)
2025年11月18日
Pandas GroupBy 的 10 个实用技巧
摘要: 很多人把 groupby 理解成单纯的求和、计数这类操作,比如说算算总收入、数数用户量,然后就没了。实际上它的应用场景要广得多:计算组内特征、数据标准化、构造滚动指标、合并不同维度的统计结果,甚至处理一些复杂的嵌套数据结构。 所以本文将介绍10个实际工作中比较有用的技巧,文章的代码都是可以直接拿来用
阅读全文
posted @ 2025-11-18 20:42 deephub
阅读(16)
评论(0)
推荐(0)
2025年11月17日
TOON:专为 LLM 设计的轻量级数据格式
摘要: 这几天好像这个叫 TOON 的东西比较火,我们这篇文章来看看他到底是什么,又有什么作用。TOON 全称 Token-Oriented Object Notation,它主要解决的问题就是当你把JSON 输入给LLM 的时候,token 消耗太高了。一个长 JSON 数组扔进模型token 计数直接起
阅读全文
posted @ 2025-11-17 21:45 deephub
阅读(37)
评论(0)
推荐(0)
2025年11月16日
Python 3.14 实用技巧:10个让代码更清晰的小改进
摘要: Python 3.14 引入的改进大多数都很细微,但这些小变化会让代码写起来更流畅,运行也更稳定。本文整理了 10 个实用的特性改进,每个都配了代码示例。 https://avoid.overfit.cn/post/8312efd2a1e94496be1c636ab538cb38
阅读全文
posted @ 2025-11-16 22:26 deephub
阅读(12)
评论(0)
推荐(0)
2025年11月15日
Python 开发必备:tempfile 模块深度解析
摘要: 处理大数据集或者生成报告、创建中间文件的时候,很多文件其实根本不需要永久保存。这时候可以用临时目录来解决这个问题。Python 标准库里的 tempfile 模块能创建用完就自动消失的临时文件和目录,省去手动清理的麻烦。临时目录就是个生命周期很短的文件夹,专门用来存放那些不需要长期保留的数据。用完之
阅读全文
posted @ 2025-11-15 21:14 deephub
阅读(8)
评论(0)
推荐(0)
2025年11月14日
超参数调优:Grid Search 和 Random Search 的实战对比
摘要: 模型训练完能够到达85%的准确率,很多人觉得就差不多了。但是通过超参数优化能让模型释放真正的潜力。最后那3-5个点的提升,往往决定了你的模型是"还行"还是"能打"。这篇文章会把Grid Search和Random Search这两种最常用的超参数优化方法进行详细的解释。从理论到数学推导,从优缺点到实
阅读全文
posted @ 2025-11-14 22:16 deephub
阅读(15)
评论(0)
推荐(0)
上一页
1
···
7
8
9
10
11
12
13
14
15
···
152
下一页
公告