deephub

2024年2月6日

摘要：本文将深入研究嵌入、矢量数据库和各种距离度量的概念，并提供示例和演示代码。 NLP中的嵌入嵌入是连续向量空间中对象、单词或实体的数值表示。在NLP中，词嵌入捕获词之间的语义关系，使算法能够更好地理解文本的上下文和含义。 https://avoid.overfit.cn/post/8c9ee01ac 阅读全文

posted @ 2024-02-06 10:19 deephub 阅读(22) 评论(0) 推荐(0) 编辑

2024年2月5日

PyTorch的10个基本张量操作

摘要： PyTorch是一个基于python的科学计算包。它的灵活性允许轻松集成新的数据类型和算法，并且框架也是高效和可扩展的，下面我们将介绍一些Pytorch的基本张量操作。 https://avoid.overfit.cn/post/3d344b08f8c1454b869ba222079e4ea7 阅读全文

posted @ 2024-02-05 10:52 deephub 阅读(16) 评论(0) 推荐(0) 编辑

2024年2月3日

12个RAG常见痛点及解决方案

摘要： Barnett等人的论文《Seven Failure Points When Engineering a Retrieval Augmented Generation System》介绍了RAG的七个痛点，我们将其延申扩展再补充开发RAG流程中常遇到的另外五个常见问题。并且将深入研究这些RAG痛点的阅读全文

posted @ 2024-02-03 10:31 deephub 阅读(88) 评论(0) 推荐(0) 编辑

2024年2月2日

10个Pandas的高级技巧

摘要： Pandas是我们最常用的数据处理Python库之一。尽管您可能已经与它共事多年，但可能还有许多您尚未探索的实用方法。我将向您展示一些可能未曾听说但在数据整理方面非常实用的方法。我目前日常使用的是pandas 2.2.0，这是本文时可用的最新版本。 https://avoid.overfit.cn 阅读全文

posted @ 2024-02-02 10:49 deephub 阅读(51) 评论(0) 推荐(0) 编辑

2024年2月1日

UniMS-RAG:用于个性化对话的统一多源RAG框架

摘要： RAG领域已经取得了相当大的发展，这篇论文的是如何分解RAG过程，加入多文件检索、记忆和个人信息等定制化的元素。大型语言模型(llm)在自然语言任务中表现出色，但在对话系统中的个性化和上下文方面面临挑战。这个研究提出了一个统一的多源检索-增强生成系统(UniMS-RAG)，通过将任务分解为知识来源阅读全文

posted @ 2024-02-01 09:59 deephub 阅读(59) 评论(0) 推荐(0) 编辑

2024年1月31日

Langchain中改进RAG能力的3种常用的扩展查询方法

摘要：有多种方法可以提高检索增强生成(RAG)的能力，其中一种方法称为查询扩展。我们这里主要介绍在Langchain中常用的3种方法查询扩展技术涉及对用户的原始查询进行细化，以生成更全面和信息丰富的搜索。使用扩展后的查询将从向量数据库中获取更多相关文档。 1、Step Back Prompting Ta 阅读全文

posted @ 2024-01-31 10:44 deephub 阅读(31) 评论(0) 推荐(0) 编辑

2024年1月30日

论文推荐:大语言模型在金融领域的应用调查

摘要：这篇论文总结了现有LLM在金融领域的应用现状，推荐和金融相关或者有兴趣的朋友都看看论文分为2大部分： 1、作者概述了使用llm的现有方法包括使用零样本或少样本的预训练模型，对特定于领域的数据进行微调，还有从头开始训练定制llm，并给出了关键模型的总结与评价。 2、根据给定的用例、数据约束、计算和阅读全文

posted @ 2024-01-30 09:51 deephub 阅读(36) 评论(0) 推荐(0) 编辑

2024年1月29日

使用核模型高斯过程(KMGPs)进行数据建模

摘要：核模型高斯过程(KMGPs)作为一种复杂的工具可以处理各种数据集的复杂性。他通过核函数来扩展高斯过程的传统概念。本文将深入探讨kmgp的理论基础、实际应用以及它们所面临的挑战。核模型高斯过程是机器学习和统计学中对传统高斯过程的一种扩展。要理解kmgp，首先掌握高斯过程的基础知识，然后了解核模型是如阅读全文

posted @ 2024-01-29 10:12 deephub 阅读(22) 评论(0) 推荐(0) 编辑

2024年1月28日

2024年1月的论文推荐

摘要：又到月底了，在月初推荐论文的基础上又整理了10篇推荐阅读的论文 1、MosaicBERT https://mosaicbert.github.io/ 一种用于快速预训练的双向编码器。MosaicBERT是针对快速预训练优化的自定义BERT架构。主要架构修改:FlashAttention, ALiBi 阅读全文

posted @ 2024-01-28 10:42 deephub 阅读(39) 评论(0) 推荐(0) 编辑

2024年1月27日

使用Transformer 模型进行时间序列预测的Pytorch代码示例

摘要：时间序列预测是一个经久不衰的主题，受自然语言处理领域的成功启发，transformer模型也在时间序列预测有了很大的发展。本文可以作为学习使用Transformer 模型的时间序列预测的一个起点。 https://avoid.overfit.cn/post/960767b198ac4d9f988fc 阅读全文

posted @ 2024-01-27 10:51 deephub 阅读(172) 评论(0) 推荐(0) 编辑

overfit深度学习

公告