随笔分类 -  GPGPU

General-purpose Computing on Graphics Processing Units
摘要:thread ID 的计算方式,简单来说很像小学学的除法公式,本文转载自同学一篇博客;并进行简单修改; 被除数 = 除数 * 商 + 余数 用公式表示:线程Id = blockId * blockSize + threadId blockId :当前 block 在 grid 中的坐标(可能是1维到 阅读全文
posted @ 2021-02-19 12:54 "Michael_Xu" 阅读(1233) 评论(0) 推荐(0) 编辑
摘要:本文章主要是记录,cuda 编程过程中遇到的相关概念,名字解释和问题;主要是是用来备忘: cuda PTX :并行线程执行(Parallel Thread eXecution,PTX)代码是编译后的GPU代码的一种中间形式,它可以再次编译为原生的GPU微码。 下面几条链接,是对nvcc 编译过程中, 阅读全文
posted @ 2019-11-11 12:31 "Michael_Xu" 阅读(744) 评论(0) 推荐(0) 编辑
摘要:为了了解,上来先看几篇中文博客进行简单了解: 如何理解Nvidia英伟达的Multi-GPU多卡通信框架NCCL?(较为优秀的文章) 使用NCCL进行NVIDIA GPU卡之间的通信 (GPU卡通信模式测试) https://developer.nvidia.com/nccl (官方网站) http 阅读全文
posted @ 2019-11-09 18:26 "Michael_Xu" 阅读(4728) 评论(0) 推荐(0) 编辑
摘要:GPU 编程可以称为异构编程,最近由于机器学习的火热,很多模型越来越依赖于GPU来进行加速运算,所以异构计算的位置越来越重要;异构编程,主要是指CPU+GPU或者CPU+其他设备(FPGA等)协同计算。当前的计算模型中,CPU主要用来进行通用计算,其更多的是注重控制,我们可以通过GPU和FPGA等做 阅读全文
posted @ 2019-08-31 15:44 "Michael_Xu" 阅读(1915) 评论(0) 推荐(0) 编辑