摘要: int8 量化是一种用于减少模型大小和计算复杂度的方法,特别是在深度学习模型中。它通过将浮点数(通常是 fp32)转换为 8 位整数 (int8),从而减少内存使用和提高计算效率。这在嵌入式设备和移动设备上特别有用。下面是 int8 量化的基本原理及其涉及的过程。 1. 为什么需要量化? 减少模型大 阅读全文
posted @ 2024-07-22 14:20 海_纳百川 阅读(231) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2024-07-22 09:24 海_纳百川 阅读(2) 评论(0) 推荐(0) 编辑
本站总访问量