摘要: 十岁的小男孩 本文为终端移植的一个小章节。 Define: 如果一个m×n阶矩阵只需要少于m×n个参数来描述,就是一个结构化矩阵(structured matrix)。 优点: 不仅能减少内存消耗,还能通过快速的矩阵-向量乘法和梯度计算显著加快推理和训练的速度。 缺点: 1.结构约束会导致精确度的损 阅读全文
posted @ 2018-11-07 17:19 weilongyitian 阅读(1281) 评论(0) 推荐(0) 编辑
摘要: 十岁的小男孩 本文为终端移植的一个小章节。 目录 概念 1. 奇异值(SVD)分解 2. 张量分解 2.1 CP 分解( Canonical Polyadic Decomposition (CPD) 2.2 TD 分解( Tucker Decomposition ) 2.3 BTD 分解(block 阅读全文
posted @ 2018-11-07 17:17 weilongyitian 阅读(35855) 评论(0) 推荐(10) 编辑
摘要: 十岁的小男孩 本文为终端移植的一个小章节。 目录 背景 理论 实践 Quantize 背景 Neural Network模型一般都会占用很大的磁盘空间,比如AlexNet的模型文件就超过了200 MB.模型包含了数百万的参数,绝大部分的空间都用来存储这些模型的参数了。这些参数是浮点数类型的,普通的压 阅读全文
posted @ 2018-11-07 17:16 weilongyitian 阅读(7490) 评论(0) 推荐(1) 编辑
摘要: 十岁的小男孩 本文为终端移植的一个小章节。 目录 背景 结构剪枝 非结构剪枝 背景 网络剪枝和共享用于降低网络复杂度和解决过拟合问题。有一种早期应用的剪枝方法称为偏差权重衰减(Biased Weight Decay),其中最优脑损伤(Optimal Brain Damage)和最优脑手术(Optim 阅读全文
posted @ 2018-11-07 17:15 weilongyitian 阅读(7042) 评论(0) 推荐(0) 编辑