书评

《 AI加速器架构设计与实现》+第一章卷积神经网络观感

picture 2
   在本书的引言中也提到“一图胜千言”,读完第一章节后,对其进行了一些归纳(如图1),第一章对常见的神经网络结构进行了介绍,举例了一些结构对应的神经网络有哪些,也看到了自己在k210中用到的FAST RCNN和RestNet18分类网络,需要保证硬件实现和算法一致,这样才事半功倍,否则,可能会差别比较大。对于神经网络算法的执行,加速器的设计十分重要,介绍了GCN模块(如下图2),指出了GCN目前面临的挑战,以及GCN模块之间的关系(如图3)。本书对网络进行抽象,得到多个更小的基本块,例如在残差块中,就出现了不同的变化方法,利用1*1的卷积进行升维和降维(如图4),还可以调整直连的位置来对其做出调整,介绍图形结合,比较利于理解。对于初端块,举例了不同初端块结构(如图5),了解到神经网络中的"跳跃连接块"(Skip Connection Block)和"组卷积块"(Grouped Convolution Block)是两种不同的网络模块,用于改进神经网络的性能和特征提取能力。跳跃连接块是一种模块,通常用于深度卷积神经网络中,特别是在残差网络(Residual Network,ResNet)中广泛使用,也是我比较熟悉的。组卷积块是一种卷积神经网络中的模块,其主要目的是将卷积操作分成多个组别进行处理。在本章节中,对常见网络算子进行了说明(如图6),卷积神经网络的核心运算方式是卷积操作,池化操作和全连接操作。

第一章思维导图

picture 0

图1 思维导图

picture 7

图2 GCN模块分布图

picture 8

图3 GCN模块之间的关系图

picture 9

图4 使用残差结构进行升维和降维

picture 10

图5 初端块不同的结构

picture 11

图6 网络常见算子
posted @   wuboy19  阅读(58)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App
点击右上角即可分享
微信分享提示