随笔分类 - 高性能计算
High Performance Computing
摘要:每个编程者都应该知道的延迟:(~2012年的性能) Latency Comparison Numbers (~2012) L1 cache reference 0.5 ns Branch mispredict 5 ns L2 cache reference 7 ns 14x L1 cache Mut
阅读全文
摘要:Overview The SC Papers program is the leading venue for presenting high-quality original research, groundbreaking ideas, and compelling insights on fu
阅读全文
摘要:为了了解,上来先看几篇中文博客进行简单了解: 如何理解Nvidia英伟达的Multi-GPU多卡通信框架NCCL?(较为优秀的文章) 使用NCCL进行NVIDIA GPU卡之间的通信 (GPU卡通信模式测试) https://developer.nvidia.com/nccl (官方网站) http
阅读全文