CUDA C编程权威指南:2.2-给核函数计时
摘要:本文主要通过例子介绍了如何给核函数计时的思路和实现。实现例子代码参考文献[7],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.用CPU计时器计时(sumArraysOnGPU-timer.cu)[7] 在主函数中用CPU计时器测试向量加法的核函数
阅读全文
posted @
2023-10-09 00:10
扫地升
阅读(536)
推荐(0) 编辑
CUDA C编程权威指南:2.1-CUDA编程模型
摘要:本文主要通过例子介绍了CUDA异构编程模型,需要说明的是Grid、Block和Thread都是逻辑结构,不是物理结构。实现例子代码参考文献[2],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.Grid、Block和Thread间的关系 GPU中最
阅读全文
posted @
2023-10-08 10:52
扫地升
阅读(573)
推荐(2) 编辑
CUDA C编程权威指南:1.3-CUDA基础知识点梳理
摘要:主要整理了N多年前(2013年)学习CUDA的时候开始总结的知识点,好长时间不写CUDA代码了,现在LLM推理需要重新学习CUDA编程,看来出来混迟早要还的。 1.CUDA数组 解析:CUDA数组是使用cudaMallocArray()、cudaMalloc3DArray()分配的,使用cudaFr
阅读全文
posted @
2023-10-05 01:28
扫地升
阅读(324)
推荐(0) 编辑
CUDA C编程权威指南:1.2-CUDA基础知识点梳理
摘要:主要整理了N多年前(2013年)学习CUDA的时候开始总结的知识点,好长时间不写CUDA代码了,现在LLM推理需要重新学习CUDA编程,看来出来混迟早要还的。 1.闭扫描和开扫描 对于一个二元运算符和一个元输入数组。如果返回输出数组为,那么是闭扫描;如果返回输出数组为,那么是开扫描。串行闭扫描算法,
阅读全文
posted @
2023-10-05 01:27
扫地升
阅读(178)
推荐(0) 编辑
CUDA C编程权威指南:1.1-CUDA基础知识点梳理
摘要:主要整理了N多年前(2013年)学习CUDA的时候开始总结的知识点,好长时间不写CUDA代码了,现在LLM推理需要重新学习CUDA编程,看来出来混迟早要还的。 1.CUDA 解析:2007年,NVIDIA推出CUDA(Compute Unified Device Architecture,统一计算设
阅读全文
posted @
2023-10-05 01:27
扫地升
阅读(512)
推荐(0) 编辑
CUDA C编程权威指南:1-基于CUDA的异构并行计算
摘要:什么是CUDA?CUDA(Compute Unified Device Architecture,统一计算设备架构)是NVIDIA(英伟达)提出的并行计算架构,结合了CPU和GPU的优点,主要用来处理密集型及并行计算。什么是异构计算?这里的异构主要指的是主机端的CPU和设备端的GPU,CPU更擅长逻
阅读全文
posted @
2023-10-05 01:26
扫地升
阅读(200)
推荐(0) 编辑