摘要: 十岁的小男孩 本文为终端移植的一个小章节。本文浅显的讲解下X-PU之间的区别,CPU、GPU、TPU、NPU、BPU、DPU。 CPU CPU( Central Processing Unit, 中央处理器)就是机器的“大脑”,也是布局谋略、发号施令、控制行动的“总司令官”。 CPU的结构主要包括运 阅读全文
posted @ 2018-11-09 17:31 weilongyitian 阅读(2559) 评论(0) 推荐(1) 编辑
摘要: 十岁的小男孩 本文为终端移植的一个小章节。 Sparse Block Net 本节为优化加速的第二章节,主要介绍Sparse-block net。上章节为OP算子层的加速,本节为层级间的加速,主要针对CNN的加速。首先通过看一篇大佬JYZhang_sh的博客,之后通过一篇论文实际应用在网络层级结构。 阅读全文
posted @ 2018-11-09 11:23 weilongyitian 阅读(742) 评论(0) 推荐(0) 编辑
摘要: 十岁的小男孩 本文为终端移植的一个小章节。 目录 引言 FFT Conv2d (7x7, 9x9) Winograd Conv2d (3x3, 5x5) 引言 本节针对CNN进行加速计算的,主要有以下两种方法,FFT和Winograd两种方法。 FFT Conv2d (7x7, 9x9) FFT(F 阅读全文
posted @ 2018-11-09 10:30 weilongyitian 阅读(1030) 评论(0) 推荐(0) 编辑