基于FPGA的CNN算法移植(五)算法优化方向汇总
以下内容为QQ聊天整理,以及网络资料整理。本人不懂算法,如有纰漏,还请指正。
以下才是真正意义上的优化,有时候我们在面试的时候遇到招 FPGA算法优化工程师,糊弄起来,是,我们用FPGA对算法实现了优化加速,其实不是真正意义上的算法优化。但是如果你面试的时候说了实话,说自己不会做算法优化,不好意思你很可能会被立马刷下来。哈哈哈,是不是很无语。
优化方式一: 量化
通常软件里采用的是32bit 浮点,需要转换成8bit定点。这个对精度影响不大。
优化方式二:图像预处理
很多公司在做CNN硬件移植的时候都做了语义分割。也有做灰度处理的。
优化方式三:裁剪分支
卷积之后的分支太多,可以裁剪掉一些不必要分支
优化方式四:平衡
有公司提到,在裁剪之后,为了让层与层之间相类似还做了平衡操作。
优化方式五:二值化
这个很多公司都在做,适合放FPGA上
优化方式六:卷积分离
同层之间卷积之后的结果分离开来,不要一起求和。
重中之重:选一个好点的网络结构,比如vgg16,yolo之类,然后再想想上面的优化方法你可以用几个
作者:清霜一梦
。。。。。。。。。。。。。。。。。。。。。
欢迎加入: FPGA广东交流群:162664354
。。。。。。。。。。。。。。。。。。。。
。。。。。。。。。。。。。。。。。。。。