摘要:
介绍如何处理多个时钟,跨时钟数据传输,介绍了握手信号、同步FIFO和异步FIFO。 阅读全文
摘要:
Computer Architecture Lecture20 和 CS6810 Chapter 5. Multiprocessors, Coherence. 的学习笔记,详细介绍了对称共享内存多处理器(SMP)和分布式内存多处理器(DMM),以及基于Snoop的缓存一致性协议和基于目录的缓存一致性协议。 阅读全文
摘要:
Digital Design and Computer Architecture Lecture21的学习笔记,介绍内存架构和子系统、内存控制器,并详细介绍了DRAM的内部结构。 阅读全文
摘要:
Digital Design and Computer Architecture Lecture23&25b&26a的学习笔记,介绍大缓存,多核缓存以及虚拟内存。 阅读全文
摘要:
高等数字集成电路课程作业的记录,都是很简单的toy design,只有VCS,Verdi和Design Compiler的脚本以及约束可供参考。 阅读全文
摘要:
Digital Design and Computer Architecture Lecture22&23的学习笔记,介绍缓存体系结构和一些缓存操作,及优化缓存的策略。 阅读全文
摘要:
现代DRAM结构由于核心速度限制,通过burst模式和多Banks结构提高带宽。CUDA中,warp级聚合内存访问减少DRAM请求,提升效率。分块访问模式通过将数据加载到共享内存中,降低全局内存访问频率,进一步优化CUDA内存访问性能。 阅读全文
摘要:
这篇文章探讨了CUDA编程中的warp和SIMD概念,以及控制分歧对性能的影响。warp是CUDA中线程调度的基本单位,每个warp包含32个线程,以SIMD方式执行相同指令。控制分歧发生在同一warp中线程因不同控制路径而导致执行效率下降。文章通过向量加法示例分析了控制分歧的影响,表明只有在特定情况下(如线程索引超出范围)才会产生控制分歧,其对性能影响通常较小。总体而言,合理设计数据结构和算法可以降低控制分歧,提升CUDA程序的性能。 阅读全文