上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 109 下一页
摘要: Encoder-decoder 模型在序列到序列的自然语言处理任务(如语言翻译等)中提供了最先进的结果。多步时间序列预测也可以被视为一个 seq2seq 任务,可以使用 encoder-decoder 模型来处理。本文提供了一个用于解决 Kaggle 时间序列预测任务的 encoder-decode 阅读全文
posted @ 2024-07-03 14:44 deephub 阅读(44) 评论(0) 推荐(0) 编辑
摘要: Kolmogorov Arnold Networks (KAN)最近作为MLP的替代而流行起来,KANs使用Kolmogorov-Arnold表示定理的属性,该定理允许神经网络的激活函数在边缘上执行,这使得激活函数“可学习”并改进它们。 目前我们看到有很多使用KAN替代MLP的实验,但是目前来说对于 阅读全文
posted @ 2024-07-02 11:38 deephub 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 长上下文大型语言模型(LCLLMs)确实引起了一些关注。这类模型可能使某些任务的解决更加高效。例如理论上可以用来对整本书进行总结。有人认为,LCLLMs不需要像RAG这样的外部工具,这有助于优化并避免级联错误。但是也有许多人对此持怀疑态度,并且后来的研究表明,这些模型并没有真正利用长上下文。还有人声 阅读全文
posted @ 2024-07-01 10:48 deephub 阅读(5) 评论(0) 推荐(0) 编辑
摘要: 与其他算法相比,高斯过程不那么流行,但是如果你只有少量的数据,那么可以首先高斯过程。在这篇文章中,我将详细介绍高斯过程。并可视化和Python实现来解释高斯过程的数学理论。 多元高斯分布 多元高斯分布是理解高斯过程所必须的概念之一。让我们快速回顾一下。如果你已经熟悉多元高斯分布,可以跳过这一部分。 阅读全文
posted @ 2024-06-30 11:49 deephub 阅读(61) 评论(0) 推荐(0) 编辑
摘要: 当Transformer模型发布时,它彻底革新了机器翻译领域。虽然最初是为特定任务设计的,但这种革命性的架构显示出它可以轻松适应不同的任务。随后成为了Transformer一个标准,甚至用于它最初设计之外的数据(如图像和其他序列数据)。 然后人们也开始优化和寻找替代方案,主要是为了减少计算成本(自注 阅读全文
posted @ 2024-06-29 10:44 deephub 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 在本文中,我们将介绍使用私有数据优化检索增强生成(RAG)的四种策略,可以提升生成任务的质量和准确性。通过使用一些优化策略,可以有效提升检索增强生成系统的性能和输出质量,使其在实际应用中能够更好地满足需求。 RAG简单回顾 RAG主要有两个过程。第一个是“数据收集过程”,它收集来自不同来源的数据,将 阅读全文
posted @ 2024-06-28 11:43 deephub 阅读(73) 评论(0) 推荐(0) 编辑
摘要: Theta方法整合了两个基本概念:分解时间序列和利用基本预测技术来估计未来的价值。 每个数据科学爱好者都知道,时间序列是按一定时间间隔收集或记录的一系列数据点。例如,每日温度或经济指标的月值。把时间序列想象成不同成分的组合,趋势(数据移动的一般方向),季节性(随时间重复的规律模式)和噪声(不能归因于 阅读全文
posted @ 2024-06-27 10:24 deephub 阅读(62) 评论(0) 推荐(0) 编辑
摘要: 知识图谱(关系网络)可以用简单的形状和线条显示复杂的系统,帮助我们理解数据之间的联系。我们今天将介绍15个很好用的免费工具,可以帮助我们绘制网络图。 NetworkX NetworkX是一个用于处理网络的Python工具。许多人在Python中处理图数据时使用NetworkX。它也是许多图AI工具的 阅读全文
posted @ 2024-06-26 11:41 deephub 阅读(90) 评论(0) 推荐(0) 编辑
摘要: 大语言模型(LLMs)在近年来取得了快速发展。本文总结了2024年6月上半月发布的一些最重要的LLM论文,可以让你及时了解最新进展。 LLM进展与基准测试 1、WildBench: Benchmarking LLMs with Challenging Tasks from Real Users in 阅读全文
posted @ 2024-06-25 12:18 deephub 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 在机器学习和数据科学的世界里,数据的质量是建模成功与否的关键所在。这就是特征工程和数据预处理发挥作用的地方。本文总结的这些关键步骤可以显著提高模型的性能,获得更准确的预测,我们将深入研究处理异常值、缺失值、编码、特征缩放和特征提取的各种技术。 https://avoid.overfit.cn/pos 阅读全文
posted @ 2024-06-24 11:02 deephub 阅读(45) 评论(0) 推荐(0) 编辑
上一页 1 ··· 13 14 15 16 17 18 19 20 21 ··· 109 下一页