书评
《 AI加速器架构设计与实现》+第一章卷积神经网络观感
在本书的引言中也提到“一图胜千言”,读完第一章节后,对其进行了一些归纳(如图1),第一章对常见的神经网络结构进行了介绍,举例了一些结构对应的神经网络有哪些,也看到了自己在k210中用到的FAST RCNN和RestNet18分类网络,需要保证硬件实现和算法一致,这样才事半功倍,否则,可能会差别比较大。对于神经网络算法的执行,加速器的设计十分重要,介绍了GCN模块(如下图2),指出了GCN目前面临的挑战,以及GCN模块之间的关系(如图3)。本书对网络进行抽象,得到多个更小的基本块,例如在残差块中,就出现了不同的变化方法,利用1*1的卷积进行升维和降维(如图4),还可以调整直连的位置来对其做出调整,介绍图形结合,比较利于理解。对于初端块,举例了不同初端块结构(如图5),了解到神经网络中的"跳跃连接块"(Skip Connection Block)和"组卷积块"(Grouped Convolution Block)是两种不同的网络模块,用于改进神经网络的性能和特征提取能力。跳跃连接块是一种模块,通常用于深度卷积神经网络中,特别是在残差网络(Residual Network,ResNet)中广泛使用,也是我比较熟悉的。组卷积块是一种卷积神经网络中的模块,其主要目的是将卷积操作分成多个组别进行处理。在本章节中,对常见网络算子进行了说明(如图6),卷积神经网络的核心运算方式是卷积操作,池化操作和全连接操作。
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· TypeScript + Deepseek 打造卜卦网站:技术与玄学的结合
· 阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?
· 如何调用 DeepSeek 的自然语言处理 API 接口并集成到在线客服系统
· 【译】Visual Studio 中新的强大生产力特性
· 2025年我用 Compose 写了一个 Todo App