deephub

2023年9月19日

摘要：重采样是时间序列分析中处理时序数据的一项基本技术。它是关于将时间序列数据从一个频率转换到另一个频率，它可以更改数据的时间间隔，通过上采样增加粒度，或通过下采样减少粒度。在本文中，我们将深入研究Pandas中重新采样的关键问题。为什么重采样很重要? 时间序列数据到达时通常带有可能与所需的分析间隔不匹阅读全文

posted @ 2023-09-19 09:41 deephub 阅读(136) 评论(0) 推荐(0)

2023年9月18日

Stability AI发布基于稳定扩散的音频生成模型Stable Audio

摘要：近日Stability AI推出了一款名为Stable Audio的尖端生成模型，该模型可以根据用户提供的文本提示来创建音乐。在NVIDIA A100 GPU上Stable Audio可以在一秒钟内以44.1 kHz的采样率产生95秒的立体声音频，与原始录音相比，该模型处理时间的大幅减少归因于它对压阅读全文

posted @ 2023-09-18 09:31 deephub 阅读(47) 评论(0) 推荐(0)

2023年9月16日

Python中进行特征重要性分析的9个常用方法

摘要：特征重要性分析用于了解每个特征(变量或输入)对于做出预测的有用性或价值。目标是确定对模型输出影响最大的最重要的特征，它是机器学习中经常使用的一种方法。为什么特征重要性分析很重要? 如果有一个包含数十个甚至数百个特征的数据集，每个特征都可能对你的机器学习模型的性能有所贡献。但是并不是所有的特征都是一阅读全文

posted @ 2023-09-16 09:12 deephub 阅读(585) 评论(0) 推荐(0)

2023年9月15日

Recognize Anything:一个强大的图像标记模型

摘要： Recognize Anything是一种新的图像标记基础模型，与传统模型不同，它不依赖于手动注释进行训练;相反，它利用大规模的图像-文本对。RAM的开发过程包括四个关键阶段: 通过自动文本语义解析获得大规模的无标注图像标签。结合标题和标注任务，训练一个自动标注的初步模型。该模型由原始文本和解析后阅读全文

posted @ 2023-09-15 09:42 deephub 阅读(100) 评论(0) 推荐(0)

2023年9月14日

向量数据库简介和5个常用的开源项目介绍

摘要：在人工智能领域，有大量的数据需要有效的处理。随着我们对人工智能应用，如图像识别、语音搜索或推荐引擎的深入研究，数据的性质变得更加复杂。这就是向量数据库发挥作用的地方。与存储标量值的传统数据库不同，向量数据库专门设计用于处理多维数据点(通常称为向量)。这些向量表示多个维度的数据，可以被认为是指向空间中阅读全文

posted @ 2023-09-14 09:36 deephub 阅读(220) 评论(0) 推荐(0)

2023年9月13日

Llama-2 推理和微调的硬件要求总结：RTX 3080 就可以微调最小模型

摘要：大语言模型微调是指对已经预训练的大型语言模型（例如Llama-2，Falcon等）进行额外的训练，以使其适应特定任务或领域的需求。微调通常需要大量的计算资源，但是通过量化和Lora等方法，我们也可以在消费级的GPU上来微调测试，但是消费级GPU也无法承载比较大的模型，经过我的测试，7B的模型可以在3 阅读全文

posted @ 2023-09-13 10:12 deephub 阅读(238) 评论(0) 推荐(0)

2023年9月12日

Falcon 180B 目前最强大的开源模型

摘要： Technology Innovation Institute最近发布了Falcon 180B大型语言模型(LLM)，它击败了Llama-2 70b，与谷歌Bard的基础模型PaLM-2 Large不相上下。 180B是是Falcon 40B模型一个最新版本。以下是该模型的快速概述: 180B参数模阅读全文

posted @ 2023-09-12 09:34 deephub 阅读(117) 评论(0) 推荐(0)

2023年9月10日

Langchain的一些问题和替代选择

摘要： Langchain因其简化大型语言模型(llm)的交互方面的到关注。凭借其高级的API可以简化将llm集成到各种应用程序中的过程。但是Langchain乍一看似乎是一个方便的工具，但是它有时候否更像是一个语言迷宫，而不是一个直截了当的解决方案。在本文中，我们将探讨与Langchain相关的一些问题阅读全文

posted @ 2023-09-10 09:15 deephub 阅读(408) 评论(0) 推荐(0)

2023年9月9日

SplitMask:大规模数据集是自我监督预训练的必要条件吗?

摘要：自监督预训练需要大规模数据集吗?这是2021年发布的一篇论文，它在自监督预训练场景中使用小数据集，如Stanford Cars, Sketch或COCO，它们比ImageNet小几个数量级。并提出了一种类似于BEiT的去噪自编码器的变体SplitMask，它对预训练数据的类型和大小具有更强的鲁棒性。阅读全文

posted @ 2023-09-09 11:42 deephub 阅读(27) 评论(0) 推荐(0)

2023年9月8日

Nougat：一种用于科学文档OCR的Transformer 模型

摘要：随着人工智能领域的不断进步，其子领域，包括自然语言处理，自然语言生成，计算机视觉等，由于其广泛的用例而迅速获得了大量的普及。光学字符识别(OCR)是计算机视觉中一个成熟且被广泛研究的领域。它有许多用途，如文档数字化、手写识别和场景文本识别。数学表达式的识别是OCR在学术研究中受到广泛关注的一个领域。阅读全文

posted @ 2023-09-08 09:36 deephub 阅读(191) 评论(0) 推荐(0)

overfit深度学习

公告