随笔分类 - 高性能计算

摘要：

终端设备上运行深度学习算法需要考虑内存和算力的需求，因此需要进行模型复杂度分析，涉及到模型计算量（时间/计算复杂度）和模型参数量（空间复杂度）分析。为了分析模型计算复杂度，一个广泛采用的度量方式是模型推断时浮点运算的次数（FLOPs），即模型理论计算量，但是，它是一个间接的度量，是对我们真正关心的直接度量比如速度或者时延的一种近似估计。阅读全文

posted @ 2022-11-28 15:28 嵌入式视觉阅读(2143) 评论(0) 推荐(0) 编辑

处理器基础知识

摘要：

先描述下一般处理器的概念，维基百科的定义是 “In computing, a processor is an electronic circuit which performs operations on some external data source, usually memory or some other data stream”。最为常见的处理器有 CPU（可以运行任何程序）、GPU（图形图像处理）和 DSP(处理数字信号)，还有专门用来做 DNN 应用神经网络处理器。阅读全文

posted @ 2022-11-24 01:04 嵌入式视觉阅读(939) 评论(0) 推荐(0) 编辑

公告

🏆 阿里云社区专家博主，大厂算法开发工程师。
👨🏻‍💻 从事视觉算法开发和模型压缩部署工作。
📫 分享技术干货、程序人生和效率工具。
👍 欢迎关注我的公众号-嵌入式视觉。导航:

扫码下方二维码，关注我的公众号

昵称：嵌入式视觉
园龄： 2年5个月
粉丝： 34
关注： 1

+加关注

2025年2月

日

一

二

三

四

五

六

armcvai

随笔分类 - 高性能计算

公告

搜索

常用链接

最新随笔

我的标签

积分与排名

随笔分类 (83)

随笔档案 (82)

相册 (2)

阅读排行榜

评论排行榜

推荐排行榜

最新评论