随笔分类 -  模型压缩和加速

研究神经网络模型的压缩和加速技术
摘要:神经网络量化是将神经网络中的参数表示为低精度的数据类型,例如8位整数或浮点数。 好处: 减少存储需求:将参数从 32位 浮点数量化为 8位 整数,可以将存储需求减少为原来的 1/4。 加速计算速度:低精度的数据类型可以在硬件上更快地进行计算。相比于32位浮点数,8位整数的计算速度可以提高数倍,因为低 阅读全文
posted @ 2023-10-07 13:20 Zenith_Hugh 阅读(114) 评论(0) 推荐(0) 编辑
摘要:| 原始题目 | Learning Efficient Convolutional Networks through Network Slimming | | | | | 中文名称 | 通过网络 瘦身(Slimming) 学习高效卷积网络 | | 发表时间 | 2017年8月22日 | | 平台 | 阅读全文
posted @ 2023-03-12 22:56 Zenith_Hugh 阅读(208) 评论(0) 推荐(0) 编辑
摘要:| 原始题目 | A Survey of Model Compression and Acceleration for Deep Neural Networks | | | | | 中文名称 | 深度神经网络的模型压缩和加速综述 | | 发表时间 | 2017年10月23日v1, 2020年6月14 阅读全文
posted @ 2023-02-22 16:30 Zenith_Hugh 阅读(812) 评论(0) 推荐(0) 编辑

喜欢请打赏

扫描二维码打赏

微信打赏

点击右上角即可分享
微信分享提示