会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
1
2
3
4
5
···
151
下一页
2026年3月2日
PhysioDSP:一个面向可穿戴设备的 Python 信号处理库
摘要: 可穿戴设备的生理信号处理是健康科技与研究领域反复出现的工程难题。ECG 记录、心率变异性指标、加速度计数据,不管处理哪一类信号,从原始传感器输出到有意义的生物标志物,整条链路都是碎片化的:算法散落在论文、代码仓库和临时脚本里,接口各不相同,数据模型也无法共享。 PhysioDSP 是一个开源 Pyt
阅读全文
posted @ 2026-03-02 21:22 deephub
阅读(1)
评论(0)
推荐(0)
2026年3月1日
VAE 原理拆解:从概率编码到潜在空间正则化
摘要: 这篇文章从基本原理出发完整拆解变分自编码器(VAE)的构建过程。重点不在数学推导而在于把概念落到足够具体的层面:完成实现、训练、调试和部署。每个组件做了什么、为什么需要它、代码里怎么写文章都会逐一交代,后半部分会逐行走读一个最小化的 PyTorch 实现,并介绍训练完成后的几种推理模式。 VAE 为
阅读全文
posted @ 2026-03-01 21:58 deephub
阅读(2)
评论(0)
推荐(0)
2026年2月28日
基于能量的模型(EBM):用能量函数替代概率分布的建模框架
摘要: Yann LeCun 反复强调过一个观点:当前LLM基于概率、逐 Token 预测的设计路线,很可能走不到人类水平的AI。他的团队更看好另一条路,基于能量的模型(EBM)。 上图来自他十多年前的一篇论文,LLM对候选答案返回"概率",EBM返回的则是"能量",能量最低的选项胜出。举个例子:输入 X
阅读全文
posted @ 2026-02-28 20:49 deephub
阅读(2)
评论(0)
推荐(0)
2026年2月27日
时间序列异常检测的5种方法:从统计阈值到深度学习
摘要: 时间序列数据随处可见:网站每分钟的访问量、传感器读数、股票价格、人流计数、服务器 CPU 使用率,都是典型场景。 多数时候这类数据遵循某种规律。异常检测的目标就是找到规律被打破的那些时刻。 什么是时间序列数据中的异常? 异常指的是与正常行为产生明显偏离的数据点或数据序列。举几个例子:凌晨 3 点网站
阅读全文
posted @ 2026-02-27 21:35 deephub
阅读(3)
评论(0)
推荐(0)
2026年2月26日
从提示工程转向 上下文工程,6种让LLM在生产环境中稳定输出的技术
摘要: RAG系统返回了完美的文本块,提示词写得很漂亮,但LLM还是在产生幻觉;文档加得越多,回复质量反而越差。这些问题问题不出在提示词上,而是出在上下文上。 提示工程告诉模型怎么说话;context engineering 控制模型说话时看到什么。以下是把生产系统和Demo区分开的6种上下文工程技术。 什
阅读全文
posted @ 2026-02-26 21:38 deephub
阅读(3)
评论(0)
推荐(0)
2026年2月25日
向量搜索系统的三个核心优化维度:速度、精度与规模
摘要: 当数据集膨胀到数百万甚至数十亿量级的向量时,怎么让搜索在这种规模下依然又快又准就成了一个实实在在的工程难题。这篇文章要聊的就是向量搜索系统的三个核心优化方向——性能调优、混合搜索和可扩展架构。 传统搜索的问题 传统搜索系统做的事情本质上是词法匹配:找文档里有没有出现查询中的关键词。至于查询背后的意思
阅读全文
posted @ 2026-02-25 20:01 deephub
阅读(3)
评论(0)
推荐(0)
2026年2月24日
手把手搭建 Adaptive RAG 系统:从向量检索到 Streamlit 前端全流程
摘要: 本文会带你从零搭建一个完整的概念验证项目(POC),技术栈涵盖 Adaptive RAG、LangGraph、FastAPI 和 Streamlit 四个核心组件。Adaptive RAG 负责根据查询复杂度自动调整检索策略;LangGraph 把多步 LLM 推理组织成有状态的可靠工作流;Fast
阅读全文
posted @ 2026-02-24 21:09 deephub
阅读(4)
评论(0)
推荐(0)
2026年2月23日
深入理解三种PEFT方法:LoRA的低秩更新、QLoRA的4位量化与DoRA的幅度-方向分解
摘要: LLaMA、Mistral、Qwen这些大语言模型动辄数十亿参数,在自定义数据上全量微调代价极高:65B 模型光是 float16 就要消耗掉约 130GB 显存,顶配硬件跑个几天几周很正常而多数下游任务根本用不到那么多参数。 于是研究者们开始思考:能不能只调一小部分参数,效果还不差?答案是可以。这
阅读全文
posted @ 2026-02-23 21:05 deephub
阅读(3)
评论(0)
推荐(0)
2026年2月22日
并行多智能体系统的协调测试实战:从轨迹捕获到CI/CD的六个步骤
摘要: 多智能体系统一旦从顺序执行走向并行,测试的需求就更严格了。单个智能体的输出可能都是对的,但多个智能体并行决策、彼此影响时,集体行为可能违反系统级约束,而传统的单元测试和输出断言对这类问题完全无能为力。 这篇文章聚焦的就是这个问题:如何测试并行多智能体系统的协调行为。以一个跨四个城市的网络流量调度系统
阅读全文
posted @ 2026-02-22 21:54 deephub
阅读(3)
评论(0)
推荐(0)
2026年2月21日
RAG 中分块重叠的 8 个隐性开销与权衡策略
摘要: RAG 分块重叠提升了召回率但增加了隐藏成本,比如说索引膨胀、Embedding 开销、延迟、重排序负载和评估漂移。 本文将总结的八项 RAG 分块重叠隐藏的成本,以及如何判断什么时候重叠真正有用,什么时候只是花钱买心安。 https://avoid.overfit.cn/post/fa6ebd13
阅读全文
posted @ 2026-02-21 21:08 deephub
阅读(5)
评论(0)
推荐(0)
1
2
3
4
5
···
151
下一页
公告