deephub

2023年12月26日

摘要：在不平衡数据上训练的分类算法往往导致预测质量差。模型严重偏向多数类，忽略了对许多用例至关重要的少数例子。这使得模型对于涉及罕见但高优先级事件的现实问题来说不切实际。过采样提供了一种在模型训练开始之前重新平衡类的方法。通过复制少数类数据点，过采样平衡了训练数据，防止算法忽略重要但数量少的类。虽然存在阅读全文

posted @ 2023-12-26 10:19 deephub 阅读(77) 评论(0) 推荐(0) 编辑

2023年12月24日

2023年小型计算机视觉总结

摘要：在过去的十年中，出现了许多涉及计算机视觉(CV)的项目，无论是小型的概念验证项目还是更大规模的生产应用。应用计算机视觉的方法是相当标准化的: 1、定义问题(分类、检测、跟踪、分割)、输入数据(图片的大小和类型、视野)和类别(正是我们想要的) 2、注释一些图片 3、选择一个网络架构，训练-验证，得到一阅读全文

posted @ 2023-12-24 10:19 deephub 阅读(12) 评论(0) 推荐(0) 编辑

2023年12月23日

论文推荐：大型语言模型能自我解释吗?

摘要：这篇论文的研究主要贡献是对LLM生成解释的优缺点进行了调查。详细介绍了两种方法，一种是做出预测，然后解释它，另一种是产生解释，然后用它来做出预测。最近的研究发现，即使LLM是在特定数据上训练的，也不能认识到训练的知识与推理上下文之间的联系。因此一些人认为之为“X链”的方法非常重要。因为要求LLM 阅读全文

posted @ 2023-12-23 10:27 deephub 阅读(8) 评论(0) 推荐(0) 编辑

2023年12月22日

神经网络可视化新工具：TorchExplorer

摘要： TorchExplorer是一个交互式探索神经网络的可视化工具，他的主要功能如下： TorchExplorer是一款创新的人工智能工具，专为使用非常规神经网络架构的研究人员设计。可以在本地或者wandb中生成交互式Vega自定义图表，提供网络结构的模块级可视化。在左边的面板可以模块级方式展现神经网络阅读全文

posted @ 2023-12-22 10:06 deephub 阅读(67) 评论(0) 推荐(0) 编辑

2023年12月21日

MLX vs MPS vs CUDA:苹果新机器学习框架的基准测试

摘要：如果你是一个Mac用户和一个深度学习爱好者，你可能希望在某些时候Mac可以处理一些重型模型。苹果刚刚发布了MLX，一个在苹果芯片上高效运行机器学习模型的框架。最近在PyTorch 1.12中引入MPS后端已经是一个大胆的步骤，但随着MLX的宣布，苹果还想在开源深度学习方面有更大的发展。在本文中，阅读全文

posted @ 2023-12-21 10:07 deephub 阅读(184) 评论(0) 推荐(0) 编辑

2023年12月20日

高维向量压缩方法IVFPQ :通过创建索引加速矢量搜索

摘要：向量相似性搜索是从特定嵌入空间中的给定向量列表中找到相似的向量。它能有效地从大型数据集中检索相关信息，在各个领域和应用中发挥着至关重要的作用。向量相似性搜索需要大量的内存资源来实现高效搜索，特别是在处理密集的向量数据集时。而压缩的主要作用是压缩高维向量来优化内存存储。 IVFPQ 是一种用于数据检阅读全文

posted @ 2023-12-20 11:03 deephub 阅读(75) 评论(0) 推荐(0) 编辑

2023年12月19日

从头开始实现LoRA以及一些实用技巧

摘要： LoRA是Low-Rank Adaptation或Low-Rank Adaptors的缩写，它提供了一种用于对预先存在的语言模型进行微调的高效且轻量级的方法。 LoRA的主要优点之一是它的效率。通过使用更少的参数，lora显著降低了计算复杂度和内存使用。这使我们能够在消费级gpu上训练大型模型，并将阅读全文

posted @ 2023-12-19 10:49 deephub 阅读(113) 评论(0) 推荐(0) 编辑

2023年12月18日

2023年12月论文推荐

摘要： 12月已经过了一半了，还有2周就是2024年了，我们来推荐下这两周我发现的一些好的论文，另外再推荐2篇很好的英文文章。 https://avoid.overfit.cn/post/4a878fde9a3f4cf3a29de4e742580d6b 阅读全文

posted @ 2023-12-18 10:00 deephub 阅读(11) 评论(0) 推荐(0) 编辑

2023年12月17日

使用LM Studio在本地运行LLM完整教程

摘要： GPT-4被普遍认为是最好的生成式AI聊天机器人，但开源模型一直在变得越来越好，并且通过微调在某些特定领域是可以超过GPT4的。在开源类别中出于以下的原因，你可能会考虑过在本地计算机上本地运行LLM ：脱机:不需要互联网连接。模型访问:在本地运行模型，可以尝试开源模型(Llama 2、Vicun 阅读全文

posted @ 2023-12-17 10:06 deephub 阅读(943) 评论(0) 推荐(0) 编辑

2023年12月16日

https://avoid.overfit.cn/post/979f42aebee34d8cab04bf591e58d782

摘要：在本文中，我将介绍matplotlib一个非常有价值的用于管理子图的函数——subplot_mosaic()。如果你想处理多个图的，那么subplot_mosaic()将成为最佳解决方案。我们将用四个不同的图实现不同的布局。首先使用Import matplotlib行导入必要的库。 https:/ 阅读全文

posted @ 2023-12-16 10:00 deephub 阅读(10) 评论(0) 推荐(0) 编辑

overfit深度学习

公告