2023 年 9月随笔档案 - deephub

LongLoRA:不需要大量计算资源的情况下增强了预训练语言模型的上下文能力

摘要：麻省理工学院和香港中文大学推出了LongLoRA，这是一种革命性的微调方法，可以在不需要大量计算资源的情况下提高大量预训练语言模型的上下文能力。 LongLoRA是一种新方法，它使改进大型语言计算机程序变得更容易，成本更低。训练LLM往往需要大量信息和花费大量的时间和计算机能力。使用大量数据(上下文阅读全文

posted @ 2023-09-30 09:31 deephub 阅读(45) 评论(0) 推荐(0) 编辑

处理不平衡数据的十大Python库

摘要：数据不平衡是机器学习中一个常见的挑战，其中一个类的数量明显超过其他类，这可能导致有偏见的模型和较差的泛化。有各种Python库来帮助有效地处理不平衡数据。在本文中，我们将介绍用于处理机器学习中不平衡数据的十大Python库，并为每个库提供代码片段和解释。 https://avoid.overfit. 阅读全文

posted @ 2023-09-29 09:35 deephub 阅读(6) 评论(0) 推荐(0) 编辑

使用高斯混合模型拆分多模态分布

摘要：本文介绍如何使用高斯混合模型将一维多模态分布拆分为多个分布。高斯混合模型（Gaussian Mixture Models，简称GMM）是一种在统计和机器学习领域中常用的概率模型，用于对复杂数据分布进行建模和分析。GMM 是一种生成模型，它假设观测数据是由多个高斯分布组合而成的，每个高斯分布称为一个阅读全文

posted @ 2023-09-28 09:02 deephub 阅读(42) 评论(0) 推荐(0) 编辑

EfficientFormer:高效低延迟的Vision Transformers

摘要：我们都知道Transformers相对于CNN的架构效率并不高，这导致在一些边缘设备进行推理时延迟会很高，所以这次介绍的论文EfficientFormer号称在准确率不降低的同时可以达到MobileNet的推理速度。 Transformers能否在获得高性能的同时，跑得和MobileNet一样快?为阅读全文

posted @ 2023-09-26 09:55 deephub 阅读(26) 评论(0) 推荐(0) 编辑

基于对数谱图的深度学习心音分类

摘要：这是一篇很有意思的论文，他基于心音信号的对数谱图，提出了两种心率音分类模型，我们都知道：频谱图在语音识别上是广泛应用的，这篇论文将心音信号作为语音信号处理，并且得到了很好的效果。对心音信号进行一致长度的分帧，提取其对数谱图特征，论文提出了长短期记忆(LSTM)和卷积神经网络(CNN)两种深度学习模阅读全文

posted @ 2023-09-25 09:04 deephub 阅读(27) 评论(0) 推荐(0) 编辑

快速找到离群值的三种方法

摘要：本文将介绍3个在数据集中查找离群值的Python方法离群值（Outliers）是指在数据集中与其他数据点明显不同或者异常的数据点。这些数据点可能比其他数据点要远离数据集的中心，或者具有异常的数值。离群值可能是由于数据采集错误、异常事件、测量误差或者其他未知因素引起的。离群值的存在可以对数据分析和阅读全文

posted @ 2023-09-24 09:27 deephub 阅读(52) 评论(0) 推荐(0) 编辑

在Python中创建相关系数矩阵的6种方法

摘要：相关系数矩阵（Correlation matrix）是数据分析的基本工具。它们让我们了解不同的变量是如何相互关联的。在Python中，有很多个方法可以计算相关系数矩阵，今天我们来对这些方法进行一个总结 Pandas Pandas的DataFrame对象可以使用corr方法直接创建相关矩阵。由于数据科阅读全文

posted @ 2023-09-23 09:13 deephub 阅读(103) 评论(0) 推荐(0) 编辑

使用QLoRA对Llama 2进行微调的详细笔记

摘要：使用QLoRA对Llama 2进行微调是我们常用的一个方法，但是在微调时会遇到各种各样的问题，所以在本文中，将尝试以详细注释的方式给出一些常见问题的答案。这些问题是特定于代码的，大多数注释都是针对所涉及的开源库以及所使用的方法和类的问题。 https://avoid.overfit.cn/post/ 阅读全文

posted @ 2023-09-21 11:22 deephub 阅读(130) 评论(0) 推荐(0) 编辑

ChatGPT可以取代搜索引擎吗？

摘要：ChatGPT对于一些简单的问题，可以完美的完成任务。但是我让它写一篇完整的文章，看看它能否代替我进行写作地的时候，我确定它不能完全取代人类。但是我们可以使用更多的指导来让AI在日常工作流程为我们工作，所以本文将讨论如何有效利用ChatGPT。这个想法是从简单的日常用例开始，然后进入更复杂的阶段。阅读全文

posted @ 2023-09-20 09:55 deephub 阅读(17) 评论(0) 推荐(0) 编辑

时间序列的重采样和pandas的resample方法介绍

摘要：重采样是时间序列分析中处理时序数据的一项基本技术。它是关于将时间序列数据从一个频率转换到另一个频率，它可以更改数据的时间间隔，通过上采样增加粒度，或通过下采样减少粒度。在本文中，我们将深入研究Pandas中重新采样的关键问题。为什么重采样很重要? 时间序列数据到达时通常带有可能与所需的分析间隔不匹阅读全文

posted @ 2023-09-19 09:41 deephub 阅读(59) 评论(0) 推荐(0) 编辑

Stability AI发布基于稳定扩散的音频生成模型Stable Audio

摘要：近日Stability AI推出了一款名为Stable Audio的尖端生成模型，该模型可以根据用户提供的文本提示来创建音乐。在NVIDIA A100 GPU上Stable Audio可以在一秒钟内以44.1 kHz的采样率产生95秒的立体声音频，与原始录音相比，该模型处理时间的大幅减少归因于它对压阅读全文

posted @ 2023-09-18 09:31 deephub 阅读(17) 评论(0) 推荐(0) 编辑

Python中进行特征重要性分析的9个常用方法

摘要：特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征，它是机器学习中经常使用的一种方法。为什么特征重要性分析很重要? 如果有一个包含数十个甚至数百个特征的数据集，每个特征都可能对你的机器学习模型的性能有所贡献。但是并不是所有的特征都是一阅读全文

posted @ 2023-09-16 09:12 deephub 阅读(363) 评论(0) 推荐(0) 编辑

Recognize Anything:一个强大的图像标记模型

摘要：Recognize Anything是一种新的图像标记基础模型，与传统模型不同，它不依赖于手动注释进行训练;相反，它利用大规模的图像-文本对。RAM的开发过程包括四个关键阶段: 通过自动文本语义解析获得大规模的无标注图像标签。结合标题和标注任务，训练一个自动标注的初步模型。该模型由原始文本和解析后阅读全文

posted @ 2023-09-15 09:42 deephub 阅读(51) 评论(0) 推荐(0) 编辑

向量数据库简介和5个常用的开源项目介绍

摘要：在人工智能领域，有大量的数据需要有效的处理。随着我们对人工智能应用，如图像识别、语音搜索或推荐引擎的深入研究，数据的性质变得更加复杂。这就是向量数据库发挥作用的地方。与存储标量值的传统数据库不同，向量数据库专门设计用于处理多维数据点(通常称为向量)。这些向量表示多个维度的数据，可以被认为是指向空间中阅读全文

posted @ 2023-09-14 09:36 deephub 阅读(126) 评论(0) 推荐(0) 编辑

Llama-2 推理和微调的硬件要求总结：RTX 3080 就可以微调最小模型

摘要：大语言模型微调是指对已经预训练的大型语言模型（例如Llama-2，Falcon等）进行额外的训练，以使其适应特定任务或领域的需求。微调通常需要大量的计算资源，但是通过量化和Lora等方法，我们也可以在消费级的GPU上来微调测试，但是消费级GPU也无法承载比较大的模型，经过我的测试，7B的模型可以在3 阅读全文

posted @ 2023-09-13 10:12 deephub 阅读(129) 评论(0) 推荐(0) 编辑

Falcon 180B 目前最强大的开源模型

摘要：Technology Innovation Institute最近发布了Falcon 180B大型语言模型(LLM)，它击败了Llama-2 70b，与谷歌Bard的基础模型PaLM-2 Large不相上下。 180B是是Falcon 40B模型一个最新版本。以下是该模型的快速概述: 180B参数模阅读全文

posted @ 2023-09-12 09:34 deephub 阅读(73) 评论(0) 推荐(0) 编辑

Langchain的一些问题和替代选择

摘要：Langchain因其简化大型语言模型(llm)的交互方面的到关注。凭借其高级的API可以简化将llm集成到各种应用程序中的过程。但是Langchain乍一看似乎是一个方便的工具，但是它有时候否更像是一个语言迷宫，而不是一个直截了当的解决方案。在本文中，我们将探讨与Langchain相关的一些问题阅读全文

posted @ 2023-09-10 09:15 deephub 阅读(325) 评论(0) 推荐(0) 编辑

SplitMask:大规模数据集是自我监督预训练的必要条件吗?

摘要：自监督预训练需要大规模数据集吗?这是2021年发布的一篇论文，它在自监督预训练场景中使用小数据集，如Stanford Cars, Sketch或COCO，它们比ImageNet小几个数量级。并提出了一种类似于BEiT的去噪自编码器的变体SplitMask，它对预训练数据的类型和大小具有更强的鲁棒性。阅读全文

posted @ 2023-09-09 11:42 deephub 阅读(10) 评论(0) 推荐(0) 编辑

Nougat：一种用于科学文档OCR的Transformer 模型

摘要：随着人工智能领域的不断进步，其子领域，包括自然语言处理，自然语言生成，计算机视觉等，由于其广泛的用例而迅速获得了大量的普及。光学字符识别(OCR)是计算机视觉中一个成熟且被广泛研究的领域。它有许多用途，如文档数字化、手写识别和场景文本识别。数学表达式的识别是OCR在学术研究中受到广泛关注的一个领域。阅读全文

posted @ 2023-09-08 09:36 deephub 阅读(143) 评论(0) 推荐(0) 编辑

CMT:卷积与Transformers的高效结合

摘要：论文提出了一种基于卷积和VIT的混合网络，利用Transformers捕获远程依赖关系，利用cnn提取局部信息。构建了一系列模型cmt，它在准确性和效率方面有更好的权衡。 CMT:体系结构 CMT块由一个局部感知单元(LPU)、一个轻量级多头自注意模块(LMHSA)和一个反向残差前馈网络(IRFFN 阅读全文

posted @ 2023-09-07 09:23 deephub 阅读(68) 评论(0) 推荐(0) 编辑

使用GPT-4生成训练数据微调GPT-3.5 RAG管道

摘要：OpenAI在2023年8月22日宣布，现在可以对GPT-3.5 Turbo进行微调了。也就是说，我们可以自定义自己的模型了。然后LlamaIndex就发布了0.8.7版本，集成了微调OpenAI gpt-3.5 turbo的功能也就是说，我们现在可以使用GPT-4生成训练数据，然后用更便宜的AP 阅读全文

posted @ 2023-09-06 10:46 deephub 阅读(131) 评论(0) 推荐(0) 编辑

Pandas DataFrame 数据存储格式比较

摘要：Pandas 支持多种存储格式，在本文中将对不同类型存储格式下的Pandas Dataframe的读取速度、写入速度和大小的进行测试对比。 https://avoid.overfit.cn/post/387acc48c7dd42a49f7bec90cc6d09ae 阅读全文

posted @ 2023-09-05 10:26 deephub 阅读(48) 评论(0) 推荐(0) 编辑

量化自定义PyTorch模型入门教程

摘要：在以前Pytorch只有一种量化的方法，叫做“eager mode qunatization”，在量化我们自定定义模型时经常会产生奇怪的错误，并且很难解决。但是最近，PyTorch发布了一种称为“fx-graph-mode-qunatization”的方方法。在本文中我们将研究这个fx-graph- 阅读全文

posted @ 2023-09-04 10:35 deephub 阅读(24) 评论(0) 推荐(0) 编辑

15个基本且常用Pandas代码片段

摘要：Pandas提供了强大的数据操作和分析功能，是数据科学的日常基本工具。在本文中，我们将介绍最常用的15个Pandas代码片段。这些片段将帮助简化数据分析任务，从数据集中提取有价值的见解。 https://avoid.overfit.cn/post/d5097a67e5c34a0ab42395d8c2 阅读全文

posted @ 2023-09-03 10:46 deephub 阅读(15) 评论(0) 推荐(0) 编辑

20用于深度学习训练和研究的数据集

摘要：数据集在计算机科学和数据科学中发挥着至关重要的作用。它们用于训练和评估机器学习模型，研究和开发新算法，改进数据质量，解决实际问题，推动科学研究，支持数据可视化，以及决策制定。数据集提供了丰富的信息，用于理解和应用数据，从而支持各种应用领域，包括医疗、金融、交通、社交媒体等。正确选择和处理数据集是确保阅读全文

posted @ 2023-09-02 09:49 deephub 阅读(35) 评论(0) 推荐(0) 编辑

Pandas 2.1发布了

摘要：2023年3月1日，Pandas 发布了2.0版本。6个月后（8月30日），更新了新的2.1版。让我们看看他有什么重要的更新。更好的PyArrow支持 PyArrow是在Panda 2.0中新加入的后端，对于大数据来说提供了优于NumPy的性能。Pandas 2.1增强了对PyArrow的支持。官阅读全文

posted @ 2023-09-01 09:25 deephub 阅读(57) 评论(0) 推荐(0) 编辑

deephub

overfit深度学习

09 2023 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论