deephub

2024年9月21日

摘要：检索增强生成（RAG）技术概述检索增强生成（Retrieval-Augmented Generation，简称 RAG）是一种旨在提升大型语言模型（Large Language Models，LLMs）性能的技术方法。其核心思想是通过整合外部可靠知识库的信息来增强模型的输出质量。 RAG 的工作原阅读全文

posted @ 2024-09-21 09:49 deephub 阅读(37) 评论(0) 推荐(0) 编辑

2024年9月20日

让模型评估模型：构建双代理RAG评估系统的步骤解析

摘要：在当前大语言模型(LLM)应用开发的背景下,一个关键问题是如何评估模型输出的准确性。我们需要确定哪些评估指标能够有效衡量提示(prompt)的效果,以及在多大程度上需要对提示进行优化。为解决这一问题,我们将介绍一个基于双代理的RAG(检索增强生成)评估系统。该系统使用生成代理和反馈代理,基于预定义阅读全文

posted @ 2024-09-20 16:42 deephub 阅读(12) 评论(0) 推荐(0) 编辑

2024年9月19日

机器学习模型中特征贡献度分析：预测贡献与错误贡献

摘要：在机器学习领域，特征重要性分析是一种广泛应用的模型解释工具。但是特征重要性并不等同于特征质量。本文将探讨特征重要性与特征有效性之间的关系，并引入两个关键概念：预测贡献度和错误贡献度。核心概念预测贡献度：衡量特征在模型预测中的权重，反映模型在训练集上识别的模式。这与传统的特征重要性概念相似。错误阅读全文

posted @ 2024-09-19 09:59 deephub 阅读(52) 评论(0) 推荐(0) 编辑

2024年9月18日

CAS-ViT:用于高效移动应用的卷积加法自注意力视觉Transformer

摘要：近年来,Vision Transformer(ViT)在计算机视觉领域取得了巨大突破。然而ViT模型通常计算复杂度高,难以在资源受限的移动设备上部署。为了解决这个问题,研究人员提出了Convolutional Additive Self-attention Vision Transformers ( 阅读全文

posted @ 2024-09-18 09:56 deephub 阅读(20) 评论(0) 推荐(0) 编辑

2024年9月17日

概率分布深度解析：PMF、PDF和CDF的技术指南

摘要：本文将深入探讨概率分布，详细阐述概率质量函数（PMF）、概率密度函数（PDF）和累积分布函数（CDF）这些核心概念，并通过实际示例进行说明。在深入探讨PMF、PDF和CDF之前，有必要先简要介绍两种常用的概率分布：正态分布和均匀分布。正态分布：也称为高斯分布或钟形曲线，正态分布以其均值为中心对阅读全文

posted @ 2024-09-17 16:55 deephub 阅读(43) 评论(0) 推荐(0) 编辑

2024年9月16日

数据稀缺条件下的时间序列微分：符号回归(Symbolic Regression)方法介绍与Python示例

摘要：时间序列概况在日常生活和专业研究中都很常见。简而言之,时间序列概况是一系列连续的数据点 y(0), y(1), ..., y(t) ,其中时间 t 的点依赖于时间 t-1 的前一个点(或更早的时间点)。在许多应用中,研究者致力于预测时间序列概况的未来行为。存在各种建模方法。这些模型通常基于过去或现阅读全文

posted @ 2024-09-16 09:45 deephub 阅读(22) 评论(0) 推荐(0) 编辑

2024年9月15日

利用未标记数据的半监督学习在模型训练中的效果评估

摘要：数据科学家在实践中经常面临的一个关键挑战是缺乏足够的标记数据来训练可靠且准确的模型。标记数据对于监督学习任务（如分类或回归）至关重要。但是在许多领域，获取标记数据往往成本高昂、耗时或不切实际。相比之下，未标记数据通常较易获取，但无法直接用于模型训练。如何利用未标记数据来改进监督学习模型？这正是半监阅读全文

posted @ 2024-09-15 17:52 deephub 阅读(14) 评论(0) 推荐(0) 编辑

2024年9月14日

MemLong: 基于记忆增强检索的长文本LLM生成方法

摘要：本文将介绍MemLong，这是一种创新的长文本语言模型生成方法。MemLong通过整合外部检索器来增强模型处理长上下文的能力，从而显著提升了大型语言模型（LLM）在长文本处理任务中的表现。核心概念 MemLong的设计理念主要包括以下几点：高效扩展LLM上下文窗口的轻量级方法。利用不可训练的外阅读全文

posted @ 2024-09-14 09:27 deephub 阅读(113) 评论(0) 推荐(0) 编辑

2024年9月13日

KAN专家混合模型在高性能时间序列预测中的应用：RMoK模型架构探析与Python代码实验

摘要： Kolmogorov-Arnold网络（KAN）的提出为深度学习领域带来了重要突破，它作为多层感知器（MLP）的一种替代方案，展现了新的可能性。MLP作为众多深度学习模型的基础构件，包括目前最先进的预测方法如N-BEATS、NHiTS和TSMixer，已经在各个领域得到广泛应用。但是我们在使用KA 阅读全文

posted @ 2024-09-13 09:41 deephub 阅读(51) 评论(0) 推荐(0) 编辑

2024年9月12日

使用ClassificationThresholdTuner进行二元和多类分类问题阈值调整，提高模型性能增强结果可解释性

摘要： AUROC 指标,顾名思义,是基于 ROC 的,ROC 是一条显示真阳性率与假阳性率关系的曲线。ROC 曲线本身并不假设使用任何特定的阈值。但是曲线上的每个点对应一个特定的阈值。在下面的图中,蓝色曲线是 ROC。这条曲线下的面积(AUROC)衡量了模型的总体性能,是在所有潜在阈值上的平均值。它衡量阅读全文

posted @ 2024-09-12 12:14 deephub 阅读(25) 评论(0) 推荐(0) 编辑

overfit深度学习

公告