08 2024 档案

摘要:广义来说并行分为俩种,提高单元效率是时域并行,一般是通过提高 utilization,而增加单元数量则是空域并行。现代处理器中往往各种并行机制混合存在,本文旨对不同的并行机制分析归类。大部分并行机制都是针对俩个问题:1)解耦单元之间的依赖关系提高并行度 [1],以及2)访存问题,后续并行机制大都可以 阅读全文
posted @ 2024-08-23 19:52 DevilXXL 阅读(26) 评论(0) 推荐(0) 编辑
摘要:ETH Computer Architecture Fall 2023 [1]课程笔记 从 parallelism 到 heterogeneity Admal's Law 和 Polloack's Rule 支撑 parallelism。理想 N 核对单核加速比遵守 \(s = \frac{1}{p 阅读全文
posted @ 2024-08-09 22:42 DevilXXL 阅读(88) 评论(0) 推荐(0) 编辑
摘要:“数学的关键是作图呐!”—— 知名数学教师,孙庆宏 Bayesian Inference Overview of IC Design 从 PPA 出发想办法把各项指标关系用一张图表示,很多地方还不是展现得很好,比如 Arch 的部分都用 utilization 概括了,用 FLOPS 表示 perf 阅读全文
posted @ 2024-08-07 15:01 DevilXXL 阅读(24) 评论(0) 推荐(0) 编辑
摘要:ZigZag 在 PE array-memory hierarchy level 上对 nested-loop based 算子数据部署设计策略进行详细分析。文章作者来自鲁汶 MICAS [1]实验室。 软硬件建模 软件上只涉及 MAC-based 的网络算子(Linear、Convolutiona 阅读全文
posted @ 2024-08-04 18:18 DevilXXL 阅读(101) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示