deephub

2023年12月22日

摘要： TorchExplorer是一个交互式探索神经网络的可视化工具，他的主要功能如下： TorchExplorer是一款创新的人工智能工具，专为使用非常规神经网络架构的研究人员设计。可以在本地或者wandb中生成交互式Vega自定义图表，提供网络结构的模块级可视化。在左边的面板可以模块级方式展现神经网络阅读全文

posted @ 2023-12-22 10:06 deephub 阅读(122) 评论(0) 推荐(0)

2023年12月21日

MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试

摘要：如果你是一个Mac用户和一个深度学习爱好者，你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX，一个在苹果芯片上高效运行机器学习模型的框架。最近在PyTorch 1.12中引入MPS后端已经是一个大胆的步骤，但随着MLX的宣布，苹果还想在开源深度学习方面有更大的发展。在本文中，阅读全文

posted @ 2023-12-21 10:07 deephub 阅读(327) 评论(0) 推荐(0)

2023年12月20日

高维向量压缩方法IVFPQ :通过创建索引加速矢量搜索

摘要：向量相似性搜索是从特定嵌入空间中的给定向量列表中找到相似的向量。它能有效地从大型数据集中检索相关信息，在各个领域和应用中发挥着至关重要的作用。向量相似性搜索需要大量的内存资源来实现高效搜索，特别是在处理密集的向量数据集时。而压缩的主要作用是压缩高维向量来优化内存存储。 IVFPQ 是一种用于数据检阅读全文

posted @ 2023-12-20 11:03 deephub 阅读(170) 评论(0) 推荐(0)

2023年12月19日

从头开始实现LoRA以及一些实用技巧

摘要： LoRA是Low-Rank Adaptation或Low-Rank Adaptors的缩写，它提供了一种用于对预先存在的语言模型进行微调的高效且轻量级的方法。 LoRA的主要优点之一是它的效率。通过使用更少的参数，lora显著降低了计算复杂度和内存使用。这使我们能够在消费级gpu上训练大型模型，并将阅读全文

posted @ 2023-12-19 10:49 deephub 阅读(213) 评论(0) 推荐(0)

2023年12月18日

2023年12月论文推荐

摘要： 12月已经过了一半了，还有2周就是2024年了，我们来推荐下这两周我发现的一些好的论文，另外再推荐2篇很好的英文文章。 https://avoid.overfit.cn/post/4a878fde9a3f4cf3a29de4e742580d6b 阅读全文

posted @ 2023-12-18 10:00 deephub 阅读(20) 评论(0) 推荐(0)

2023年12月17日

使用LM Studio在本地运行LLM完整教程

摘要： GPT-4被普遍认为是最好的生成式AI聊天机器人，但开源模型一直在变得越来越好，并且通过微调在某些特定领域是可以超过GPT4的。在开源类别中出于以下的原因，你可能会考虑过在本地计算机上本地运行LLM ：脱机:不需要互联网连接。模型访问:在本地运行模型，可以尝试开源模型(Llama 2、Vicun 阅读全文

posted @ 2023-12-17 10:06 deephub 阅读(1290) 评论(0) 推荐(0)

2023年12月16日

https://avoid.overfit.cn/post/979f42aebee34d8cab04bf591e58d782

摘要：在本文中，我将介绍matplotlib一个非常有价值的用于管理子图的函数——subplot_mosaic()。如果你想处理多个图的，那么subplot_mosaic()将成为最佳解决方案。我们将用四个不同的图实现不同的布局。首先使用Import matplotlib行导入必要的库。 https:/ 阅读全文

posted @ 2023-12-16 10:00 deephub 阅读(40) 评论(0) 推荐(0)

2023年12月15日

一种用于心音分类的轻量级1D-CNN+DWT网络

摘要：这是由National Institute of Technology Rourkela, Central University of Rajasthan发布在2022 ICETCI的论文，利用离散小波变换(DWT)得到的多分辨率域特征对1D-CNN模型进行心音分类训练。 https://avoid 阅读全文

posted @ 2023-12-15 09:21 deephub 阅读(79) 评论(0) 推荐(0)

2023年12月14日

使用GAN进行异常检测

摘要：自从基于Stable Diffusion的生成模型大火以后，基于GAN的研究越来越少了，但是这并不能说明他就没有用了。异常检测是多个研究领域面临的重要问题，包括金融、医疗保健和网络安全。检测和正确分类未见的异常是一个具有挑战性的问题，多年来已经以许多不同的方式解决了这个问题。而今天我们要介绍一种基于阅读全文

posted @ 2023-12-14 09:52 deephub 阅读(266) 评论(0) 推荐(0)

2023年12月13日

AutoGen多代理对话项目示例和工作流程分析

摘要：在这篇文章中，我将介绍AutoGen的多个代理的运行。这些代理将能够相互对话，协作评估股票价格，并使用AmCharts生成图表。我们创建对话的目的是要求代理分析特定公司的股票价格，并制作股票价格图表。为了实现这一目标，我们创建一下代理并协同工作: https://avoid.overfit.cn 阅读全文

posted @ 2023-12-13 09:53 deephub 阅读(139) 评论(0) 推荐(0)

overfit深度学习

公告