会员
周边
新闻
博问
闪存
赞助商
YouClaw
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
deephub
overfit深度学习
博客园
首页
新随笔
联系
订阅
管理
上一页
1
···
47
48
49
50
51
52
53
54
55
···
154
下一页
2024年10月30日
基于图论的时间序列数据平稳性与连通性分析:利用图形、数学和 Python 揭示时间序列数据中的隐藏模式
摘要: 时间序列数据表示了一个随时间记录的值的序列。理解这些序列内部的关系,尤其是在多元或复杂的时间序列数据中,不仅仅局限于随时间绘制数据点(这并不是说这种做法不好)。通过将时间序列数据转换为图,我们可以揭示数据片段内部隐藏的连接、模式和关系,帮助我们发现平稳性和时间连通性等性质,这就是图论发挥作用的地方。
阅读全文
posted @ 2024-10-30 09:40 deephub
阅读(80)
评论(0)
推荐(0)
2024年10月28日
深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究
摘要: 深度学习实践者都知道,在训练神经网络时,正确设置学习率是使模型达到良好性能的关键因素之一。学习率通常会在训练过程中根据某种调度策略进行动态调整。调度策略的选择对训练质量也有很大影响。 大多数实践者采用一些广泛使用的学习率调度策略,例如阶梯式衰减或余弦退火。这些调度策略中的许多是为特定的基准任务量身定
阅读全文
posted @ 2024-10-28 09:47 deephub
阅读(136)
评论(0)
推荐(0)
2024年10月27日
过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比
摘要: 在现实场景中,收集一个每个类别样本数量完全相同的数据集是十分困难的。实际数据往往是不平衡的,这对于分类模型的训练可能会造成问题。当模型在这样一个不平衡数据集上训练时,由于某个类别的样本数量远多于其他类别,模型通常会更擅长预测样本量较大的类别,而在预测小类别时表现不佳。为了缓解这一问题,我们可以使用过
阅读全文
posted @ 2024-10-27 09:39 deephub
阅读(168)
评论(0)
推荐(0)
2024年10月26日
LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势
摘要: 近年来,大型语言模型(Large Language Models,LLMs)在自然语言处理领域取得了显著进展。受此启发,研究人员开始探索将LLMs应用于时间序列预测任务的可能性。由于时间序列数据与文本数据在特征上存在显著差异,直接将LLMs应用于时间序列预测仍面临诸多挑战。 为了解决这一问题,Jin
阅读全文
posted @ 2024-10-26 09:52 deephub
阅读(237)
评论(0)
推荐(0)
2024年10月25日
RAPTOR:多模型融合+层次结构 = 检索性能提升20%,结果还更稳健
摘要: 在现代信息检索领域,单一检索模型的局限性日益显现。本文深入探讨如何通过多模型集成技术提升检索系统的性能,并详细介绍RAPTOR(Recursive Abstractive Processing for Tree-Organized Retrieval)框架的实现机制。这一研究建立在之前探讨的RAG
阅读全文
posted @ 2024-10-25 09:42 deephub
阅读(92)
评论(0)
推荐(0)
2024年10月24日
梯度累积的隐藏陷阱:Transformer库中梯度累积机制的缺陷与修正
摘要: 在本地环境下对大规模语言模型(LLMs)进行微调时,由于GPU显存限制,采用大批量训练通常难以实现。为解决此问题,一般普遍会采用梯度累积技术来模拟较大的批量规模。该方法不同于传统的每批次更新模型权重的方式,而是通过在多个小批量上累积梯度,在达到预设的累积次数后才执行权重更新。这种方法有效地实现了大批
阅读全文
posted @ 2024-10-24 09:40 deephub
阅读(112)
评论(0)
推荐(0)
2024年10月23日
TimeDART:基于扩散自回归Transformer 的自监督时间序列预测方法
摘要: 近年来,随着机器学习技术的进步,深度神经网络已经成为解决时间序列预测问题的主流方法。这反映了学术界和工业界在利用先进技术处理序列数据复杂性方面的持续努力。 自监督学习概述 基本定义 自监督学习是一种创新的学习范式,其特点是模型能够从未标记数据中通过内部生成的监督信号进行学习,通常这种学习通过预文任务
阅读全文
posted @ 2024-10-23 11:36 deephub
阅读(115)
评论(0)
推荐(0)
2024年10月22日
11种经典时间序列预测方法:理论、Python实现与应用
摘要: 时间序列分析和预测在现代数据科学中扮演着关键角色,广泛应用于金融、经济、气象学和工程等领域。本文将总结11种经典的时间序列预测方法,并提供它们在Python中的实现示例。 这些方法包括: 自回归(AR) 移动平均(MA) 自回归移动平均(ARMA) 自回归积分移动平均(ARIMA) 季节性自回归积分
阅读全文
posted @ 2024-10-22 09:34 deephub
阅读(280)
评论(0)
推荐(0)
2024年10月21日
MoH:融合混合专家机制的高效多头注意力模型及其在视觉语言任务中的应用
摘要: 在深度学习领域,多头注意力机制一直是Transformer模型的核心组成部分,在自然语言处理和计算机视觉任务中取得了巨大成功。然而,研究表明并非所有的注意力头都具有同等重要性,许多注意力头可以在不影响模型精度的情况下被剪枝。基于这一洞察,这篇论文提出了一种名为混合头注意力(Mixture-of-He
阅读全文
posted @ 2024-10-21 09:18 deephub
阅读(168)
评论(0)
推荐(0)
2024年10月20日
机器学习中空间和时间自相关的分析:从理论基础到实践应用
摘要: 空间和时间自相关是数据分析中的两个基本概念,它们揭示了现象在空间和时间维度上的相互依赖关系。这些概念在各个领域都有广泛应用,从环境科学到城市规划,从流行病学到经济学。本文将探讨这些概念的理论基础,并通过一个实际的野火风险预测案例来展示它们的应用。 图1: 空间自相关的不同模式:(a) 负自相关,(b
阅读全文
posted @ 2024-10-20 09:26 deephub
阅读(81)
评论(0)
推荐(0)
上一页
1
···
47
48
49
50
51
52
53
54
55
···
154
下一页
公告