随笔分类 -  高性能计算

High Performance Computing
摘要:每个编程者都应该知道的延迟:(~2012年的性能) Latency Comparison Numbers (~2012) L1 cache reference 0.5 ns Branch mispredict 5 ns L2 cache reference 7 ns 14x L1 cache Mut 阅读全文
posted @ 2021-11-26 20:51 "Michael_Xu" 阅读(278) 评论(0) 推荐(0) 编辑
摘要:Overview The SC Papers program is the leading venue for presenting high-quality original research, groundbreaking ideas, and compelling insights on fu 阅读全文
posted @ 2021-11-23 14:15 "Michael_Xu" 阅读(166) 评论(0) 推荐(0) 编辑
摘要:为了了解,上来先看几篇中文博客进行简单了解: 如何理解Nvidia英伟达的Multi-GPU多卡通信框架NCCL?(较为优秀的文章) 使用NCCL进行NVIDIA GPU卡之间的通信 (GPU卡通信模式测试) https://developer.nvidia.com/nccl (官方网站) http 阅读全文
posted @ 2019-11-09 18:26 "Michael_Xu" 阅读(4728) 评论(0) 推荐(0) 编辑