随笔分类 -  高性能计算

摘要:神经网络模型复杂度分析终端设备上运行深度学习算法需要考虑内存和算力的需求,因此需要进行模型复杂度分析,涉及到模型计算量(时间/计算复杂度)和模型参数量(空间复杂度)分析。 为了分析模型计算复杂度,一个广泛采用的度量方式是模型推断时浮点运算的次数 (FLOPs),即模型理论计算量,但是,它是一个间接的度量,是对我们真正关心的直接度量比如速度或者时延的一种近似估计。 阅读全文
posted @ 2022-11-28 15:28 嵌入式视觉 阅读(2143) 评论(0) 推荐(0) 编辑
摘要:处理器基础知识先描述下一般处理器的概念,维基百科的定义是 “In computing, a processor is an electronic circuit which performs operations on some external data source, usually memory or some other data stream”。最为常见的处理器有 CPU(可以运行任何程序)、GPU(图形图像处理)和 DSP(处理数字信号),还有专门用来做 DNN 应用神经网络处理器。 阅读全文
posted @ 2022-11-24 01:04 嵌入式视觉 阅读(939) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示