08 2024 档案
摘要:广义来说并行分为俩种,提高单元效率是时域并行,一般是通过提高 utilization,而增加单元数量则是空域并行。现代处理器中往往各种并行机制混合存在,本文旨对不同的并行机制分析归类。大部分并行机制都是针对俩个问题:1)解耦单元之间的依赖关系提高并行度 [1],以及2)访存问题,后续并行机制大都可以
阅读全文
摘要:ETH Computer Architecture Fall 2023 [1]课程笔记 从 parallelism 到 heterogeneity Admal's Law 和 Polloack's Rule 支撑 parallelism。理想 N 核对单核加速比遵守 \(s = \frac{1}{p
阅读全文
摘要:“数学的关键是作图呐!”—— 知名数学教师,孙庆宏 Bayesian Inference Overview of IC Design 从 PPA 出发想办法把各项指标关系用一张图表示,很多地方还不是展现得很好,比如 Arch 的部分都用 utilization 概括了,用 FLOPS 表示 perf
阅读全文
摘要:ZigZag 在 PE array-memory hierarchy level 上对 nested-loop based 算子数据部署设计策略进行详细分析。文章作者来自鲁汶 MICAS [1]实验室。 软硬件建模 软件上只涉及 MAC-based 的网络算子(Linear、Convolutiona
阅读全文