deephub

2024年7月3日

使用 PyTorch 创建的多步时间序列预测的 Encoder-Decoder 模型

摘要： Encoder-decoder 模型在序列到序列的自然语言处理任务（如语言翻译等）中提供了最先进的结果。多步时间序列预测也可以被视为一个 seq2seq 任务，可以使用 encoder-decoder 模型来处理。本文提供了一个用于解决 Kaggle 时间序列预测任务的 encoder-decode 阅读全文

posted @ 2024-07-03 14:44 deephub 阅读(44) 评论(0) 推荐(0) 编辑

2024年7月2日

图神经网络版本的Kolmogorov Arnold（KAN）代码实现和效果对比

摘要： Kolmogorov Arnold Networks (KAN)最近作为MLP的替代而流行起来，KANs使用Kolmogorov-Arnold表示定理的属性，该定理允许神经网络的激活函数在边缘上执行，这使得激活函数“可学习”并改进它们。目前我们看到有很多使用KAN替代MLP的实验，但是目前来说对于阅读全文

posted @ 2024-07-02 11:38 deephub 阅读(146) 评论(0) 推荐(0) 编辑

2024年7月1日

DeepMind的新论文，长上下文的大语言模型能否取代RAG或者SQL这样的传统技术呢?

摘要：长上下文大型语言模型（LCLLMs）确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为，LCLLMs不需要像RAG这样的外部工具，这有助于优化并避免级联错误。但是也有许多人对此持怀疑态度，并且后来的研究表明，这些模型并没有真正利用长上下文。还有人声阅读全文

posted @ 2024-07-01 10:48 deephub 阅读(5) 评论(0) 推荐(0) 编辑

2024年6月30日

深入解析高斯过程：数学理论、重要概念和直观可视化全解

摘要：与其他算法相比，高斯过程不那么流行，但是如果你只有少量的数据，那么可以首先高斯过程。在这篇文章中，我将详细介绍高斯过程。并可视化和Python实现来解释高斯过程的数学理论。多元高斯分布多元高斯分布是理解高斯过程所必须的概念之一。让我们快速回顾一下。如果你已经熟悉多元高斯分布，可以跳过这一部分。阅读全文

posted @ 2024-06-30 11:49 deephub 阅读(61) 评论(0) 推荐(0) 编辑

2024年6月29日

Transformer 能代替图神经网络吗?

摘要：当Transformer模型发布时，它彻底革新了机器翻译领域。虽然最初是为特定任务设计的，但这种革命性的架构显示出它可以轻松适应不同的任务。随后成为了Transformer一个标准，甚至用于它最初设计之外的数据（如图像和其他序列数据）。然后人们也开始优化和寻找替代方案，主要是为了减少计算成本（自注阅读全文

posted @ 2024-06-29 10:44 deephub 阅读(21) 评论(0) 推荐(0) 编辑

2024年6月28日

RAG流程优化（微调）的4个基本策略

摘要：在本文中，我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略，可以提升生成任务的质量和准确性。通过使用一些优化策略，可以有效提升检索增强生成系统的性能和输出质量，使其在实际应用中能够更好地满足需求。 RAG简单回顾 RAG主要有两个过程。第一个是“数据收集过程”，它收集来自不同来源的数据，将阅读全文

posted @ 2024-06-28 11:43 deephub 阅读(73) 评论(0) 推荐(0) 编辑

2024年6月27日

Theta方法：一种时间序列分解与预测的简化方法

摘要： Theta方法整合了两个基本概念:分解时间序列和利用基本预测技术来估计未来的价值。每个数据科学爱好者都知道，时间序列是按一定时间间隔收集或记录的一系列数据点。例如，每日温度或经济指标的月值。把时间序列想象成不同成分的组合，趋势(数据移动的一般方向)，季节性(随时间重复的规律模式)和噪声(不能归因于阅读全文

posted @ 2024-06-27 10:24 deephub 阅读(62) 评论(0) 推荐(0) 编辑

2024年6月26日

精选：15款顶尖Python知识图谱（关系网络）绘制工具，数据分析的强力助手

摘要：知识图谱（关系网络）可以用简单的形状和线条显示复杂的系统，帮助我们理解数据之间的联系。我们今天将介绍15个很好用的免费工具，可以帮助我们绘制网络图。 NetworkX NetworkX是一个用于处理网络的Python工具。许多人在Python中处理图数据时使用NetworkX。它也是许多图AI工具的阅读全文

posted @ 2024-06-26 11:41 deephub 阅读(90) 评论(0) 推荐(0) 编辑

2024年6月25日

2024年6月上半月30篇大语言模型的论文推荐

摘要：大语言模型（LLMs）在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文，可以让你及时了解最新进展。 LLM进展与基准测试 1、WildBench: Benchmarking LLMs with Challenging Tasks from Real Users in 阅读全文

posted @ 2024-06-25 12:18 deephub 阅读(27) 评论(0) 推荐(0) 编辑

2024年6月24日

特征工程与数据预处理全解析：基础技术和代码示例

摘要：在机器学习和数据科学的世界里，数据的质量是建模成功与否的关键所在。这就是特征工程和数据预处理发挥作用的地方。本文总结的这些关键步骤可以显著提高模型的性能，获得更准确的预测，我们将深入研究处理异常值、缺失值、编码、特征缩放和特征提取的各种技术。 https://avoid.overfit.cn/pos 阅读全文

posted @ 2024-06-24 11:02 deephub 阅读(45) 评论(0) 推荐(0) 编辑

overfit深度学习

公告