deephub

2024年11月2日

摘要：在机器学习教学实践中,我们常会遇到这样一个问题:"模型表现非常出色,准确率超过90%!但当将其提交到隐藏数据集进行测试时,效果却大打折扣。问题出在哪里?"这种情况几乎总是与数据泄露有关。当测试数据在数据准备阶段无意中泄露(渗透)到训练数据时,就会发生数据泄露。这种情况经常出现在常规数据处理任务中, 阅读全文

posted @ 2024-11-02 09:37 deephub 阅读(13) 评论(0) 推荐(0) 编辑

2024年11月1日

随机性、熵与随机数生成器:解析伪随机数生成器（PRNG）和真随机数生成器（TRNG）

摘要：随机性在诸多领域中扮演着至关重要的角色,涵盖密码学、仿真和机器学习等方面。因为随机性为无偏决策、不可预测序列和安全加密提供了基础。然而生成随机数是一项复杂的任务,理解伪随机数生成(pseudo-random number generation, PRNG)与真随机数生成(true random nu 阅读全文

posted @ 2024-11-01 09:42 deephub 阅读(26) 评论(0) 推荐(0) 编辑

2024年10月31日

Github上的十大RAG(信息检索增强生成)框架

摘要：信息检索增强生成(Retrieval-Augmented Generation,简称RAG)是一种强大的技术,能够显著提升大型语言模型的性能。RAG框架巧妙地结合了基于检索的系统和生成模型的优势,可以生成更加准确、符合上下文、实时更新的响应。随着对先进人工智能解决方案需求的不断增长,GitHub上涌阅读全文

posted @ 2024-10-31 09:29 deephub 阅读(48) 评论(0) 推荐(0) 编辑

2024年10月30日

基于图论的时间序列数据平稳性与连通性分析：利用图形、数学和 Python 揭示时间序列数据中的隐藏模式

摘要：时间序列数据表示了一个随时间记录的值的序列。理解这些序列内部的关系,尤其是在多元或复杂的时间序列数据中,不仅仅局限于随时间绘制数据点(这并不是说这种做法不好)。通过将时间序列数据转换为图,我们可以揭示数据片段内部隐藏的连接、模式和关系,帮助我们发现平稳性和时间连通性等性质，这就是图论发挥作用的地方。阅读全文

posted @ 2024-10-30 09:40 deephub 阅读(29) 评论(0) 推荐(0) 编辑

2024年10月28日

深度学习中的学习率调度:循环学习率、SGDR、1cycle 等方法介绍及实践策略研究

摘要：深度学习实践者都知道,在训练神经网络时,正确设置学习率是使模型达到良好性能的关键因素之一。学习率通常会在训练过程中根据某种调度策略进行动态调整。调度策略的选择对训练质量也有很大影响。大多数实践者采用一些广泛使用的学习率调度策略,例如阶梯式衰减或余弦退火。这些调度策略中的许多是为特定的基准任务量身定阅读全文

posted @ 2024-10-28 09:47 deephub 阅读(24) 评论(0) 推荐(0) 编辑

2024年10月27日

过采样与欠采样技术原理图解:基于二维数据的常见方法效果对比

摘要：在现实场景中,收集一个每个类别样本数量完全相同的数据集是十分困难的。实际数据往往是不平衡的,这对于分类模型的训练可能会造成问题。当模型在这样一个不平衡数据集上训练时,由于某个类别的样本数量远多于其他类别,模型通常会更擅长预测样本量较大的类别,而在预测小类别时表现不佳。为了缓解这一问题,我们可以使用过阅读全文

posted @ 2024-10-27 09:39 deephub 阅读(37) 评论(0) 推荐(0) 编辑

2024年10月26日

LLM-Mixer: 融合多尺度时间序列分解与预训练模型,可以精准捕捉短期波动与长期趋势

摘要：近年来,大型语言模型(Large Language Models,LLMs)在自然语言处理领域取得了显著进展。受此启发,研究人员开始探索将LLMs应用于时间序列预测任务的可能性。由于时间序列数据与文本数据在特征上存在显著差异,直接将LLMs应用于时间序列预测仍面临诸多挑战。为了解决这一问题,Jin 阅读全文

posted @ 2024-10-26 09:52 deephub 阅读(62) 评论(0) 推荐(0) 编辑

2024年10月25日

RAPTOR：多模型融合+层次结构 = 检索性能提升20%，结果还更稳健

摘要：在现代信息检索领域，单一检索模型的局限性日益显现。本文深入探讨如何通过多模型集成技术提升检索系统的性能，并详细介绍RAPTOR（Recursive Abstractive Processing for Tree-Organized Retrieval）框架的实现机制。这一研究建立在之前探讨的RAG 阅读全文

posted @ 2024-10-25 09:42 deephub 阅读(20) 评论(0) 推荐(0) 编辑

2024年10月24日

梯度累积的隐藏陷阱：Transformer库中梯度累积机制的缺陷与修正

摘要：在本地环境下对大规模语言模型（LLMs）进行微调时，由于GPU显存限制，采用大批量训练通常难以实现。为解决此问题，一般普遍会采用梯度累积技术来模拟较大的批量规模。该方法不同于传统的每批次更新模型权重的方式，而是通过在多个小批量上累积梯度，在达到预设的累积次数后才执行权重更新。这种方法有效地实现了大批阅读全文

posted @ 2024-10-24 09:40 deephub 阅读(34) 评论(0) 推荐(0) 编辑

2024年10月23日

TimeDART：基于扩散自回归Transformer 的自监督时间序列预测方法

摘要：近年来，随着机器学习技术的进步，深度神经网络已经成为解决时间序列预测问题的主流方法。这反映了学术界和工业界在利用先进技术处理序列数据复杂性方面的持续努力。自监督学习概述基本定义自监督学习是一种创新的学习范式，其特点是模型能够从未标记数据中通过内部生成的监督信号进行学习，通常这种学习通过预文任务阅读全文

posted @ 2024-10-23 11:36 deephub 阅读(29) 评论(0) 推荐(0) 编辑

overfit深度学习

公告