日照金城 - 博客园

2024年12月14日

摘要：本文将介绍模型剪枝的概念、方法和流程，这是一种通过移除神经网络中的冗余或不重要参数来减小模型规模和提高效率的模型压缩技术。剪枝不仅可以减少模型的存储和计算需求，还能在保持模型性能的同时提高模型的泛化能力。我们将探讨剪枝的定义、分类、不同阶段的剪枝流程，以及多种剪枝算法，包括基于参数重要性的方法、结阅读全文

posted @ 2024-12-14 00:02 日照金城阅读(9) 评论(0) 推荐(0) 编辑

转载：【AI系统】训练后量化与部署

摘要：本文将会重点介绍训练后量化技术的两种方式：动态和静态方法，将模型权重和激活从浮点数转换为整数，以减少模型大小和加速推理。并以 KL 散度作为例子讲解校准方法和量化粒度控制来平衡模型精度和性能。训练后量化的方式训练后量化的方式主要分为动态和静态两种。动态离线量化动态离线量化（Post Trai 阅读全文

posted @ 2024-12-14 00:01 日照金城阅读(13) 评论(0) 推荐(0) 编辑

转载：【AI系统】感知量化训练 QAT

摘要：本文将会介绍感知量化训练（QAT）流程，这是一种在训练期间模拟量化操作的方法，用于减少将神经网络模型从 FP32 精度量化到 INT8 时的精度损失。QAT 通过在模型中插入伪量化节点（FakeQuant）来模拟量化误差，并在训练过程中最小化这些误差，最终得到一个适应量化环境的模型。文中还会讨论伪阅读全文

posted @ 2024-12-14 00:00 日照金城阅读(11) 评论(0) 推荐(0) 编辑

转载：【AI系统】低比特量化原理

摘要：计算机里面数值有很多种表示方式，如浮点表示的 FP32、FP16，整数表示的 INT32、INT16、INT8，量化一般是将 FP32、FP16 降低为 INT8 甚至 INT4 等低比特表示。模型量化则是一种将浮点值映射到低比特离散值的技术，可以有效的减少模型的参数大小、内存消耗和推理延迟，但往阅读全文

posted @ 2024-12-14 00:00 日照金城阅读(12) 评论(0) 推荐(0) 编辑

2024年12月13日

转载：【AI系统】模型压缩基本介绍

摘要：随着神经网络模型的复杂性和规模不断增加，模型对存储空间和计算资源的需求越来越多，使得部署和运行成本显著上升。模型压缩的目标是通过减少模型的存储空间、减少计算量或提高模型的计算效率，从而在保持模型性能的同时，降低模型部署的成本。模型压缩的目标可以概括为以下几点：减少模型显存占用：通过压缩模型参数或使阅读全文

posted @ 2024-12-13 23:17 日照金城阅读(13) 评论(0) 推荐(0) 编辑

转载：【AI系统】EfficientFormer 系列

摘要：本文主要介绍一种轻量化的 Transformer 结构，在获得高性能的同时，能够保持一定的推理速度。以延迟为目标进行优化设计。通过延迟分析重新探讨 ViT 及其变体的设计原则。 EfficientFormer V1 模型 EfficientFormer V1:基于 ViT 的模型中使用的网络架构和具阅读全文

posted @ 2024-12-13 23:16 日照金城阅读(9) 评论(0) 推荐(0) 编辑

转载：【AI系统】MobileFormer

摘要：在本文中，将介绍一种新的网络-MobileFormer，它实现了 Transformer 全局特征与 CNN 局部特征的融合，在较低的成本内，创造一个高效的网络。通过本文，让大家去了解如何将 CNN 与 Transformer 更好的结合起来，同时实现模型的轻量化。 MobileFormer Mob 阅读全文

posted @ 2024-12-13 23:16 日照金城阅读(5) 评论(0) 推荐(0) 编辑

转载：【AI系统】MobileVit 系列

摘要：自 Vision Transformer 出现之后，人们发现 Transformer 也可以应用在计算机视觉领域，并且效果还是非常不错的。但是基于 Transformer 的网络模型通常具有数十亿或数百亿个参数，这使得它们的模型文件非常大，不仅占用大量存储空间，而且在训练和部署过程中也需要更多的计算阅读全文

posted @ 2024-12-13 23:16 日照金城阅读(5) 评论(0) 推荐(0) 编辑

转载：【AI系统】GhostNet 系列

摘要：本文主要会介绍 GhostNet 系列网络，在本文中会给大家带来卷积结构的改进方面的轻量化，以及与注意力(self-attention)模块的进行结合，部署更高效，更适合移动计算的 GhostNetV2。让读者更清楚的区别 V2 与 V1 之间的区别。 GhostNet V1 模型 GhostNet 阅读全文

posted @ 2024-12-13 23:15 日照金城阅读(7) 评论(0) 推荐(0) 编辑

转载：【AI系统】EfficientNet 系列

摘要：本文主要介绍 EfficientNet 系列，在之前的文章中，一般都是单独增加图像分辨率或增加网络深度或单独增加网络的宽度，来提高网络的准确率。而在 EfficientNet 系列论文中，会介绍使用网络搜索技术(NAS)去同时探索网络的宽度(width)，深度(depth)，分辨率(resoluti 阅读全文

posted @ 2024-12-13 23:15 日照金城阅读(9) 评论(0) 推荐(0) 编辑

rizhaojincheng

公告