基于caffe模型的模型裁剪和量化

原论文《 Deep Compression: Compressing Deep Neural Networks with Pruning, Trained Quantization and Huffman coding》https://arxiv.org/abs/1510.00149；

摘要：

通过剪枝、权重共享和权重量化以及哈夫曼编码等方法，作者在AlexNet和VGG-16 等模型上使用这些方法，可以在没有精度损失的情况下，把alexnet模型参数压缩35倍，把VGG模型参数压缩49倍。

1、剪枝就是去掉一些不必要的网络权重，只保留对网络重要的权重参数

2、权值共享就是多个神经元的链接采用同一个权值，权重量化就是用更少的比特来标志一个权值

3、对权值进行哈夫曼编码减少冗余

方法：

2.1 剪枝

剪枝生成稀疏矩阵：设置一个阈值，把小于阈值的链接设置为0，后续不在参与训练，然后对网络进行训练，得到一个稀疏的权值矩阵。韩松论文，其余的：https://blog.csdn.net/weixin_36474809/article/details/80643784

2.2 代码实现：

cafffe的代码实现： https://github.com/may0324/DeepCompression-caffe；韩松的论文实现结果：https://github.com/songhan/Deep-Compression-AlexNet。定义了mask变量，对权重比较小的值，裁剪后设置mask位，后续迭代运算时不对裁剪的权重进行diff计算。