摘要:
评估指标是用于评估机器学习模型性能的定量指标。它们提供了一种系统和客观的方法来比较不同的模型并衡量它们在解决特定问题方面的成功程度。通过比较不同模型的结果并评估其性能可以对使用哪些模型、如何改进现有模型以及如何优化给定任务的性能做出正确的决定,所以评估指标在机器学习模型的开发和部署中发挥着至关重要的 阅读全文
摘要:
混合精度已经成为训练大型深度学习模型的必要条件,但也带来了许多挑战。将模型参数和梯度转换为较低精度数据类型(如FP16)可以加快训练速度,但也会带来数值稳定性的问题。使用进行FP16 训练梯度更容易溢出或不足,导致优化器计算不精确,以及产生累加器超出数据类型范围的等问题。 在这篇文章中,我们将讨论混 阅读全文
摘要:
Numpy 是一个强大的 Python 计算库。它提供了广泛的数学函数,可以对数组和矩阵执行各种操作。本文中将整理一些基本和常用的数学操作。 基本数学运算:Numpy 提供了许多基本数学函数,用于对数组执行加、减、乘、除等运算。这些函数包括 numpy.add()、numpy.subtract()、 阅读全文
摘要:
本文将演示 3 个处理时间序列数据最常用的 pandas 操作 首先我们要导入需要的库: importpandasaspd importnumpyasnp importmatplotlib.pyplotasplt 本文使用的数据集非常简单。它只有 1 列,名为 VPact (mbar),表示气候中的 阅读全文
摘要:
本文将展示如何使用JAX/Flax实现Vision Transformer (ViT),以及如何使用JAX/Flax训练ViT。 Vision Transformer 在实现Vision Transformer时,首先要记住这张图。 以下是论文描述的ViT执行过程。 从输入图像中提取补丁图像,并将其 阅读全文
摘要:
混合模型ACmix将自注意与卷积的整合,同时具有自注意和卷积的优点。这是清华大学、华为和北京人工智能研究院共同发布在2022年CVPR中的论文 卷积分解与自注意力 卷积分解 标准卷积: https://avoid.overfit.cn/post/a56a24e0637e4ae38d1e2459a1d 阅读全文
摘要:
在本文中,我们将介绍一种从相关特征的高维数据中选择或提取特征的有用方法。 谱聚类是一种基于图论的聚类方法,通过对样本数据的拉普拉斯矩阵的特征向量进行聚类,从而达到对样本数据聚类的目的。谱聚类可以理解为将高维空间的数据映射到低维,然后在低维空间用其它聚类算法(如KMeans)进行聚类 本文使用2021 阅读全文
摘要:
apply函数是我们经常用到的一个Pandas操作。虽然这在较小的数据集上不是问题,但在处理大量数据时,由此引起的性能问题会变得更加明显。虽然apply的灵活性使其成为一个简单的选择,但本文介绍了其他Pandas函数作为潜在的替代方案。 在这篇文章中,我们将通过一些示例讨论apply、agg、map 阅读全文
摘要:
本文整理了 2023 年 1 月5 篇著名的 AI 论文,涵盖了计算机视觉、自然语言处理等方面的新研究。 InstructPix2Pix: Learning to Follow Image Editing Instructions 伯克利分校的研究人员开发了一种使用人工指令编辑图像的新方法。通过结合 阅读全文
摘要:
作为机器学习从业者,我们经常会遇到这样的情况,想要训练一个比较大的模型,而 GPU 却因为内存不足而无法训练它。当我们在出于安全原因不允许在云计算的环境中工作时,这个问题经常会出现。在这样的环境中,我们无法足够快地扩展或切换到功能强大的硬件并训练模型。并且由于梯度下降算法的性质,通常较大的批次在大多 阅读全文