deephub

2023年10月14日

摘要： Pandas是一种流行的用于数据操作的Python库，它提供了一种称为“向量化”的强大技术可以有效地将操作应用于整个列或数据系列，从而消除了显式循环的需要。在本文中，我们将探讨什么是向量化，以及它如何简化数据分析任务。 https://avoid.overfit.cn/post/ae2f68c9b2 阅读全文

posted @ 2023-10-14 10:01 deephub 阅读(48) 评论(0) 推荐(0) 编辑

2023年10月13日

TimesNet:时间序列预测的最新模型

摘要： 2020年发布的N-BEATS、2022年发布的N-HiTS和2023年3月发布的PatchTST开始。N-BEATS和N-HiTS依赖于多层感知器架构，而PatchTST利用了Transformer架构。 2023年4月发表了一个新的模型，它在时间序列分析的多个任务中实现了最先进的结果，如预测、i 阅读全文

posted @ 2023-10-13 09:48 deephub 阅读(593) 评论(0) 推荐(0) 编辑

2023年10月11日

GPU 虚拟化技术MIG简介和安装使用教程

摘要：使用多实例GPU (MIG/Multi-Instance GPU)可以将强大的显卡分成更小的部分，每个部分都有自己的工作，这样单张显卡可以同时运行不同的任务。本文将对其进行简单介绍并且提供安装和使用的示例。什么是MIG NVIDIA Multi-Instance GPU (MIG) 技术是 NVI 阅读全文

posted @ 2023-10-11 09:36 deephub 阅读(150) 评论(0) 推荐(0) 编辑

2023年10月10日

常用的相似度度量总结：余弦相似度，点积，L1，L2

摘要：相似性度量在机器学习中起着至关重要的作用。这些度量以数学方式量化对象、数据点或向量之间的相似性。理解向量空间中的相似性概念并采用适当的度量是解决广泛的现实世界问题的基础。本文将介绍几种常用的用来计算两个向量在嵌入空间中的接近程度的相似性度量。 https://avoid.overfit.cn/pos 阅读全文

posted @ 2023-10-10 09:49 deephub 阅读(86) 评论(0) 推荐(0) 编辑

2023年10月9日

三个主要降维技术对比介绍：PCA, LCA,SVD

摘要：随着数据集的规模和复杂性的增长，特征或维度的数量往往变得难以处理，导致计算需求增加，潜在的过拟合和模型可解释性降低。降维技术提供了一种补救方法，它捕获数据中的基本信息，同时丢弃冗余或信息较少的特征。这个过程不仅简化了计算任务，还有助于可视化数据趋势，减轻维度诅咒的风险，并提高机器学习模型的泛化性能。阅读全文

posted @ 2023-10-09 09:37 deephub 阅读(34) 评论(0) 推荐(0) 编辑

2023年10月8日

XGBoost 2.0:对基于树的方法进行了重大更新

摘要： XGBoost是处理不同类型表格数据的最著名的算法，LightGBM 和Catboost也是为了修改他的缺陷而发布的。9月12日XGBoost发布了新的2.0版，本文除了介绍让XGBoost的完整历史以外，还将介绍新机制和更新。这是一篇很长的文章，因为我们首先从梯度增强决策树开始。基于树的方法，阅读全文

posted @ 2023-10-08 09:46 deephub 阅读(81) 评论(0) 推荐(0) 编辑

2023年10月7日

从GPU的内存访问视角对比NHWC和NCHW

摘要： NHWC和NCHW是卷积神经网络(cnn)中广泛使用的数据格式。它们决定了多维数据，如图像、点云或特征图如何存储在内存中。 NHWC(样本数，高度，宽度，通道):这种格式存储数据通道在最后，是TensorFlow的默认格式。 NCHW(样本数，通道，高度，宽度):通道位于高度和宽度尺寸之前，经常与P 阅读全文

posted @ 2023-10-07 09:30 deephub 阅读(117) 评论(0) 推荐(0) 编辑

2023年9月30日

LongLoRA:不需要大量计算资源的情况下增强了预训练语言模型的上下文能力

摘要：麻省理工学院和香港中文大学推出了LongLoRA，这是一种革命性的微调方法，可以在不需要大量计算资源的情况下提高大量预训练语言模型的上下文能力。 LongLoRA是一种新方法，它使改进大型语言计算机程序变得更容易，成本更低。训练LLM往往需要大量信息和花费大量的时间和计算机能力。使用大量数据(上下文阅读全文

posted @ 2023-09-30 09:31 deephub 阅读(42) 评论(0) 推荐(0) 编辑

2023年9月29日

处理不平衡数据的十大Python库

摘要：数据不平衡是机器学习中一个常见的挑战，其中一个类的数量明显超过其他类，这可能导致有偏见的模型和较差的泛化。有各种Python库来帮助有效地处理不平衡数据。在本文中，我们将介绍用于处理机器学习中不平衡数据的十大Python库，并为每个库提供代码片段和解释。 https://avoid.overfit. 阅读全文

posted @ 2023-09-29 09:35 deephub 阅读(5) 评论(0) 推荐(0) 编辑

2023年9月28日

使用高斯混合模型拆分多模态分布

摘要：本文介绍如何使用高斯混合模型将一维多模态分布拆分为多个分布。高斯混合模型（Gaussian Mixture Models，简称GMM）是一种在统计和机器学习领域中常用的概率模型，用于对复杂数据分布进行建模和分析。GMM 是一种生成模型，它假设观测数据是由多个高斯分布组合而成的，每个高斯分布称为一个阅读全文

posted @ 2023-09-28 09:02 deephub 阅读(40) 评论(0) 推荐(0) 编辑

overfit深度学习

公告