deephub

2024年11月9日

通过pin_memory 优化 PyTorch 数据加载和传输:工作原理、使用场景与性能分析

摘要：在 PyTorch 框架中,有一个看似简单的设置可以对模型性能产生重大影响: pin_memory 。这个设置具体起到了什么作用,为什么需要关注它呢?如果你正在处理大规模数据集、实时推理或复杂的多 GPU 训练任务,将 pin_memory 设为 True 可以提高 CPU 与 GPU 之间的数据传阅读全文

posted @ 2024-11-09 09:49 deephub 阅读(141) 评论(0) 推荐(0)

2024年11月8日

贝叶斯统计中常见先验分布选择方法总结

摘要：在贝叶斯统计中,选择合适的先验分布是一个关键步骤。本文将详细介绍三种主要的先验分布选择方法: 经验贝叶斯方法信息先验无信息/弱信息先验经验贝叶斯方法经验贝叶斯方法是一种最大似然估计(MLE)方法,通过最大化先验分布下数据的边际似然来估计先验分布的参数。设X表示数据,θ表示参数,则经验贝叶斯估阅读全文

posted @ 2024-11-08 17:19 deephub 阅读(188) 评论(0) 推荐(0)

2024年11月7日

Tokenformer：基于参数标记化的高效可扩展Transformer架构

摘要：本文是对发表于arXiv的论文 "TOKENFORMER: RETHINKING TRANSFORMER SCALING WITH TOKENIZED MODEL PARAMETERS" 的深入解读与扩展分析。主要探讨了一种革新性的Transformer架构设计方案，该方案通过参数标记化实现了模型的阅读全文

posted @ 2024-11-07 09:44 deephub 阅读(80) 评论(0) 推荐(0)

2024年11月6日

基于LLM Graph Transformer的知识图谱构建技术研究：LangChain框架下转换机制实践

摘要：文本到图谱的转换是一个具有技术挑战性的研究领域，其核心任务是将非结构化文本数据转换为结构化的图谱表示。这种技术虽然由来已久，但随着大型语言模型(LLMs)的发展，其应用范围得到了显著扩展，并逐渐成为主流技术方案之一。上图展示了信息抽取过程中文本到知识图谱的转换。图左侧展示了包含个人与公司关系描述的阅读全文

posted @ 2024-11-06 09:52 deephub 阅读(99) 评论(0) 推荐(0)

2024年11月5日

基于Liquid State Machine的时间序列预测:利用储备池计算实现高效建模

摘要： Liquid State Machine (LSM) 是一种脉冲神经网络 (Spiking Neural Network, SNN) ,在计算神经科学和机器学习领域中得到广泛应用,特别适用于处理时变或动态数据。它是受大脑自然信息处理过程启发而提出的一种脉冲神经网络。设想你正处于一片平静的湖阅读全文

posted @ 2024-11-05 09:45 deephub 阅读(151) 评论(0) 推荐(0)

2024年11月4日

深入理解多重共线性:基本原理、影响、检验与修正策略

摘要：在数据科学和机器学习领域,构建可靠且稳健的模型是进行准确预测和获得有价值见解的关键。然而当模型中的变量开始呈现出高度相关性时,就会出现一个常见但容易被忽视的问题 —— 多重共线性。多重共线性是指两个或多个预测变量之间存在强相关性,导致模型难以区分它们对目标变量的贡献。如果忽视多重共线性,它会扭曲模型阅读全文

posted @ 2024-11-04 09:30 deephub 阅读(138) 评论(0) 推荐(0)

2024年11月3日

基于PyTorch的大语言模型微调指南：Torchtune完整教程与代码示例

摘要：近年来,大型语言模型(Large Language Models, LLMs)在自然语言处理(Natural Language Processing, NLP)领域取得了显著进展。这些模型通过在大规模文本数据上进行预训练,能够习得语言的基本特征和语义,从而在各种NLP任务上取得了突破性的表现。为了将阅读全文

posted @ 2024-11-03 09:32 deephub 阅读(111) 评论(0) 推荐(0)

2024年11月2日

10种数据预处理中的数据泄露模式解析:识别与避免策略

摘要：在机器学习教学实践中,我们常会遇到这样一个问题:"模型表现非常出色,准确率超过90%!但当将其提交到隐藏数据集进行测试时,效果却大打折扣。问题出在哪里?"这种情况几乎总是与数据泄露有关。当测试数据在数据准备阶段无意中泄露(渗透)到训练数据时,就会发生数据泄露。这种情况经常出现在常规数据处理任务中, 阅读全文

posted @ 2024-11-02 09:37 deephub 阅读(78) 评论(0) 推荐(0)

2024年11月1日

随机性、熵与随机数生成器:解析伪随机数生成器（PRNG）和真随机数生成器（TRNG）

摘要：随机性在诸多领域中扮演着至关重要的角色,涵盖密码学、仿真和机器学习等方面。因为随机性为无偏决策、不可预测序列和安全加密提供了基础。然而生成随机数是一项复杂的任务,理解伪随机数生成(pseudo-random number generation, PRNG)与真随机数生成(true random nu 阅读全文

posted @ 2024-11-01 09:42 deephub 阅读(181) 评论(0) 推荐(0)

2024年10月31日

Github上的十大RAG(信息检索增强生成)框架

摘要：信息检索增强生成(Retrieval-Augmented Generation,简称RAG)是一种强大的技术,能够显著提升大型语言模型的性能。RAG框架巧妙地结合了基于检索的系统和生成模型的优势,可以生成更加准确、符合上下文、实时更新的响应。随着对先进人工智能解决方案需求的不断增长,GitHub上涌阅读全文

posted @ 2024-10-31 09:29 deephub 阅读(219) 评论(0) 推荐(0)

overfit深度学习

公告