12 2023 档案

摘要:在使用机器学习构建预测模型时,我们不只是想知道“预测值(点预测)”,而是想知道“预测值落在某个范围内的可能性有多大(区间预测)”。例如当需要进行需求预测时,如果只储备最可能的需求预测量,那么缺货的概率非常的大。但是如果库存处于预测的第95个百分位数(需求有95%的可能性小于或等于该值),那么缺货数量 阅读全文
posted @ 2023-12-31 10:01 deephub 阅读(143) 评论(0) 推荐(0) 编辑
摘要:RAG结合了两个关键元素:检索和生成。它首先使用语义搜索等高级技术来浏览大量数据,包括文本、图像、音频和视频。RAG的本质在于它能够检索相关信息,然后作为下一阶段的基础。生成组件利用大型语言模型的能力,解释这些数据块,制作连贯的、类似人类的响应。与传统的生成模型相比,这个过程确保RAG系统可以提供更 阅读全文
posted @ 2023-12-30 09:47 deephub 阅读(23) 评论(0) 推荐(0) 编辑
摘要:CNN and Bidirectional GRU-Based Heartbeat Sound Classification Architecture for Elderly People是发布在2023 MDPI Mathematics上的论文,提出了基于卷积神经网络和双向门控循环单元(CNN + 阅读全文
posted @ 2023-12-29 19:11 deephub 阅读(16) 评论(0) 推荐(0) 编辑
摘要:人工智能辅助撰写文章的技术现在无处不在!ChatGPT已经解锁了许多基于语言的人工智能应用程序,人工智能在任何类型的内容生成中的使用都已经达到了以前前所未有的高度。 在诸如创意写作之类的工作中,人们被要求创造自己的内容。但是由于人工智能在这些任务中的普及和有效性,很人工智能很有可能会被滥用。所以能够 阅读全文
posted @ 2023-12-28 10:39 deephub 阅读(9) 评论(0) 推荐(0) 编辑
摘要:模型评估是深度学习和机器学习中非常重要的一部分,用于衡量模型的性能和效果。本文将逐步分解混淆矩阵,准确性,精度,召回率和F1分数。 https://avoid.overfit.cn/post/90571a2233f64dbc80c6732f3e817d6c 阅读全文
posted @ 2023-12-27 10:41 deephub 阅读(22) 评论(0) 推荐(0) 编辑
摘要:在不平衡数据上训练的分类算法往往导致预测质量差。模型严重偏向多数类,忽略了对许多用例至关重要的少数例子。这使得模型对于涉及罕见但高优先级事件的现实问题来说不切实际。 过采样提供了一种在模型训练开始之前重新平衡类的方法。通过复制少数类数据点,过采样平衡了训练数据,防止算法忽略重要但数量少的类。虽然存在 阅读全文
posted @ 2023-12-26 10:19 deephub 阅读(87) 评论(0) 推荐(0) 编辑
摘要:在过去的十年中,出现了许多涉及计算机视觉(CV)的项目,无论是小型的概念验证项目还是更大规模的生产应用。应用计算机视觉的方法是相当标准化的: 1、定义问题(分类、检测、跟踪、分割)、输入数据(图片的大小和类型、视野)和类别(正是我们想要的) 2、注释一些图片 3、选择一个网络架构,训练-验证,得到一 阅读全文
posted @ 2023-12-24 10:19 deephub 阅读(16) 评论(0) 推荐(0) 编辑
摘要:这篇论文的研究主要贡献是对LLM生成解释的优缺点进行了调查。详细介绍了两种方法,一种是做出预测,然后解释它,另一种是产生解释,然后用它来做出预测。 最近的研究发现,即使LLM是在特定数据上训练的,也不能认识到训练的知识与推理上下文之间的联系。 因此一些人认为之为“X链”的方法非常重要。因为要求LLM 阅读全文
posted @ 2023-12-23 10:27 deephub 阅读(11) 评论(0) 推荐(0) 编辑
摘要:TorchExplorer是一个交互式探索神经网络的可视化工具,他的主要功能如下: TorchExplorer是一款创新的人工智能工具,专为使用非常规神经网络架构的研究人员设计。可以在本地或者wandb中生成交互式Vega自定义图表,提供网络结构的模块级可视化。在左边的面板可以模块级方式展现神经网络 阅读全文
posted @ 2023-12-22 10:06 deephub 阅读(84) 评论(0) 推荐(0) 编辑
摘要:如果你是一个Mac用户和一个深度学习爱好者,你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX,一个在苹果芯片上高效运行机器学习模型的框架。 最近在PyTorch 1.12中引入MPS后端已经是一个大胆的步骤,但随着MLX的宣布,苹果还想在开源深度学习方面有更大的发展。 在本文中, 阅读全文
posted @ 2023-12-21 10:07 deephub 阅读(217) 评论(0) 推荐(0) 编辑
摘要:向量相似性搜索是从特定嵌入空间中的给定向量列表中找到相似的向量。它能有效地从大型数据集中检索相关信息,在各个领域和应用中发挥着至关重要的作用。 向量相似性搜索需要大量的内存资源来实现高效搜索,特别是在处理密集的向量数据集时。而压缩的主要作用是压缩高维向量来优化内存存储。 IVFPQ 是一种用于数据检 阅读全文
posted @ 2023-12-20 11:03 deephub 阅读(91) 评论(0) 推荐(0) 编辑
摘要:LoRA是Low-Rank Adaptation或Low-Rank Adaptors的缩写,它提供了一种用于对预先存在的语言模型进行微调的高效且轻量级的方法。 LoRA的主要优点之一是它的效率。通过使用更少的参数,lora显著降低了计算复杂度和内存使用。这使我们能够在消费级gpu上训练大型模型,并将 阅读全文
posted @ 2023-12-19 10:49 deephub 阅读(126) 评论(0) 推荐(0) 编辑
摘要:12月已经过了一半了,还有2周就是2024年了,我们来推荐下这两周我发现的一些好的论文,另外再推荐2篇很好的英文文章。 https://avoid.overfit.cn/post/4a878fde9a3f4cf3a29de4e742580d6b 阅读全文
posted @ 2023-12-18 10:00 deephub 阅读(11) 评论(0) 推荐(0) 编辑
摘要:GPT-4被普遍认为是最好的生成式AI聊天机器人,但开源模型一直在变得越来越好,并且通过微调在某些特定领域是可以超过GPT4的。在开源类别中出于以下的原因,你可能会考虑过在本地计算机上本地运行LLM : 脱机:不需要互联网连接。 模型访问:在本地运行模型,可以尝试开源模型(Llama 2、Vicun 阅读全文
posted @ 2023-12-17 10:06 deephub 阅读(1086) 评论(0) 推荐(0) 编辑
摘要:在本文中,我将介绍matplotlib一个非常有价值的用于管理子图的函数——subplot_mosaic()。如果你想处理多个图的,那么subplot_mosaic()将成为最佳解决方案。我们将用四个不同的图实现不同的布局。 首先使用Import matplotlib行导入必要的库。 https:/ 阅读全文
posted @ 2023-12-16 10:00 deephub 阅读(11) 评论(0) 推荐(0) 编辑
摘要:这是由National Institute of Technology Rourkela, Central University of Rajasthan发布在2022 ICETCI的论文,利用离散小波变换(DWT)得到的多分辨率域特征对1D-CNN模型进行心音分类训练。 https://avoid 阅读全文
posted @ 2023-12-15 09:21 deephub 阅读(39) 评论(0) 推荐(0) 编辑
摘要:自从基于Stable Diffusion的生成模型大火以后,基于GAN的研究越来越少了,但是这并不能说明他就没有用了。异常检测是多个研究领域面临的重要问题,包括金融、医疗保健和网络安全。检测和正确分类未见的异常是一个具有挑战性的问题,多年来已经以许多不同的方式解决了这个问题。而今天我们要介绍一种基于 阅读全文
posted @ 2023-12-14 09:52 deephub 阅读(196) 评论(0) 推荐(0) 编辑
摘要:在这篇文章中,我将介绍AutoGen的多个代理的运行。这些代理将能够相互对话,协作评估股票价格,并使用AmCharts生成图表。 我们创建对话的目的是要求代理分析特定公司的股票价格,并制作股票价格图表。 为了实现这一目标,我们创建一下代理并协同工作: https://avoid.overfit.cn 阅读全文
posted @ 2023-12-13 09:53 deephub 阅读(87) 评论(0) 推荐(0) 编辑
摘要:为了增强CLIP在图像理解和编辑方面的能力,上海交通大学、复旦大学、香港中文大学、上海人工智能实验室、澳门大学以及MThreads Inc.等知名机构共同合作推出了Alpha-CLIP。这一创新性的突破旨在克服CLIP的局限性,通过赋予其识别特定区域(由点、笔画或掩码定义)的能力。Alpha-CLI 阅读全文
posted @ 2023-12-12 09:32 deephub 阅读(69) 评论(0) 推荐(0) 编辑
摘要:Pytorch团队提出了一种纯粹通过PyTorch新特性在的自下而上的优化LLM方法,包括: Torch.compile: PyTorch模型的编译器 GPU量化:通过降低精度操作来加速模型 推测解码:使用一个小的“草稿”模型来加速llm来预测一个大的“目标”模型的输出 张量并行:通过在多个设备上运 阅读全文
posted @ 2023-12-11 09:45 deephub 阅读(39) 评论(0) 推荐(0) 编辑
摘要:推理正在成为大型语言模型(llm)关注的下一个主要领域。尽管llm拥有先进的能力,但大多数llm经常被简单的错误绊倒,显示出他们在推理方面的局限性。这些模型可能会被上下文中的不相关细节所误导,或者受到输入提示中的偏差的影响。而后一种倾向被称为谄媚,也就是说模型会更偏向与输入一致,而不管准确性如何。人 阅读全文
posted @ 2023-12-10 10:36 deephub 阅读(76) 评论(0) 推荐(0) 编辑
摘要:Matplotlib是一个Python中常用的绘图库,用于创建各种类型的图表。在Matplotlib中,你可以使用titles(标题)、labels(标签)和legends(图例)来增强你的图表。本文讨论Python的Matplotlib绘图库中可用的不同标记选项。 https://avoid.ov 阅读全文
posted @ 2023-12-09 11:19 deephub 阅读(41) 评论(0) 推荐(0) 编辑
摘要:本文从数据科学家的角度来研究检索增强生成(retrieve - augmented Generation, RAG)管道。讨论潜在的“超参数”,这些参数都可以通过实验来提高RAG管道的性能。与本文还将介绍可以应用的不同策略,这些策略虽然不是超参数,但对性能也会产生很大的影响。 本文将介绍以下索引阶段 阅读全文
posted @ 2023-12-08 09:53 deephub 阅读(8) 评论(0) 推荐(0) 编辑
摘要:EDA或探索性数据分析是一项耗时的工作,但是由于EDA是不可避免的,所以Python出现了很多自动化库来减少执行分析所需的时间。EDA的主要目标不是制作花哨的图形或创建彩色的图形,而是获得对数据集的理解,并获得对变量之间的分布和相关性的初步见解。我们在以前也介绍过EDA自动化的库,但是现在已经过了1 阅读全文
posted @ 2023-12-07 11:33 deephub 阅读(24) 评论(0) 推荐(0) 编辑
摘要:在股票市场交易的动态环境中,技术和金融的融合催生了分析市场趋势和预测未来价格走势的先进方法。本文将使用Python进行股票模式识别。 from collections import defaultdict import numpy as np import pandas as pd import m 阅读全文
posted @ 2023-12-06 10:00 deephub 阅读(92) 评论(0) 推荐(0) 编辑
摘要:ChatGPT已经成为家喻户晓的名字,而大语言模型在ChatGPT刺激下也得到了快速发展,这使得我们可以基于这些技术来改进我们的业务。 但是大语言模型像所有机器/深度学习模型一样,从数据中学习。因此也会有garbage in garbage out的规则。也就是说如果我们在低质量的数据上训练模型,那 阅读全文
posted @ 2023-12-05 09:41 deephub 阅读(99) 评论(0) 推荐(0) 编辑
摘要:现在已经是12月了,距离2024年只有一个月了,本文总结了11月的一些比较不错的大语言模型相关论文 https://avoid.overfit.cn/post/ca7d20ae68dd4f54a69d7d2d5df51e8d 阅读全文
posted @ 2023-12-04 10:06 deephub 阅读(28) 评论(0) 推荐(0) 编辑
摘要:在本文中,我将分享4个在一行代码中完成的Pandas操作。这些操作可以有效地解决特定的任务,并以一种好的方式给出结果。 https://avoid.overfit.cn/post/1e70db7ef5534ff0801316609a1499b1 阅读全文
posted @ 2023-12-03 10:14 deephub 阅读(3) 评论(0) 推荐(0) 编辑
摘要:高斯混合模型(gmm)是将数据表示为高斯(正态)分布的混合的统计模型。这些模型可用于识别数据集中的组,并捕获数据分布的复杂、多模态结构。 gmm可用于各种机器学习应用,包括聚类、密度估计和模式识别。 在本文中,将首先探讨混合模型,重点是高斯混合模型及其基本原理。然后将研究如何使用一种称为期望最大化( 阅读全文
posted @ 2023-12-02 11:04 deephub 阅读(33) 评论(0) 推荐(0) 编辑
摘要:在这篇文章中我将深入探讨来自苏黎世联邦理工学院计算机科学系的Bobby He和Thomas Hofmann在他们的论文“Simplifying Transformer Blocks”中介绍的Transformer技术的进化步骤。这是自Transformer 开始以来,我看到的最好的改进。 大型语言模 阅读全文
posted @ 2023-12-01 11:30 deephub 阅读(100) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示