摘要:
十岁的小男孩 本文为终端移植的一个小章节。 Sparse Block Net 本节为优化加速的第二章节,主要介绍Sparse-block net。上章节为OP算子层的加速,本节为层级间的加速,主要针对CNN的加速。首先通过看一篇大佬JYZhang_sh的博客,之后通过一篇论文实际应用在网络层级结构。 阅读全文
摘要:
十岁的小男孩 本文为终端移植的一个小章节。 目录 引言 FFT Conv2d (7x7, 9x9) Winograd Conv2d (3x3, 5x5) 引言 本节针对CNN进行加速计算的,主要有以下两种方法,FFT和Winograd两种方法。 FFT Conv2d (7x7, 9x9) FFT(F 阅读全文