随笔 - 128  文章 - 0  评论 - 75  阅读 - 11万

随笔分类 -  CUDA C编程权威指南

CUDA C编程权威指南:2.2-给核函数计时
摘要:本文主要通过例子介绍了如何给核函数计时的思路和实现。实现例子代码参考文献[7],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.用CPU计时器计时(sumArraysOnGPU-timer.cu)[7] 在主函数中用CPU计时器测试向量加法的核函数 阅读全文
posted @ 2023-10-09 00:10 扫地升 阅读(536) 评论(0) 推荐(0) 编辑
CUDA C编程权威指南:2.1-CUDA编程模型
摘要:本文主要通过例子介绍了CUDA异构编程模型,需要说明的是Grid、Block和Thread都是逻辑结构,不是物理结构。实现例子代码参考文献[2],只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.Grid、Block和Thread间的关系 GPU中最 阅读全文
posted @ 2023-10-08 10:52 扫地升 阅读(573) 评论(0) 推荐(2) 编辑
CUDA C编程权威指南:1.3-CUDA基础知识点梳理
摘要:主要整理了N多年前(2013年)学习CUDA的时候开始总结的知识点,好长时间不写CUDA代码了,现在LLM推理需要重新学习CUDA编程,看来出来混迟早要还的。 1.CUDA数组 解析:CUDA数组是使用cudaMallocArray()、cudaMalloc3DArray()分配的,使用cudaFr 阅读全文
posted @ 2023-10-05 01:28 扫地升 阅读(324) 评论(0) 推荐(0) 编辑
CUDA C编程权威指南:1.2-CUDA基础知识点梳理
摘要:主要整理了N多年前(2013年)学习CUDA的时候开始总结的知识点,好长时间不写CUDA代码了,现在LLM推理需要重新学习CUDA编程,看来出来混迟早要还的。 1.闭扫描和开扫描 对于一个二元运算符和一个元输入数组。如果返回输出数组为,那么是闭扫描;如果返回输出数组为,那么是开扫描。串行闭扫描算法, 阅读全文
posted @ 2023-10-05 01:27 扫地升 阅读(178) 评论(0) 推荐(0) 编辑
CUDA C编程权威指南:1.1-CUDA基础知识点梳理
摘要:主要整理了N多年前(2013年)学习CUDA的时候开始总结的知识点,好长时间不写CUDA代码了,现在LLM推理需要重新学习CUDA编程,看来出来混迟早要还的。 1.CUDA 解析:2007年,NVIDIA推出CUDA(Compute Unified Device Architecture,统一计算设 阅读全文
posted @ 2023-10-05 01:27 扫地升 阅读(512) 评论(0) 推荐(0) 编辑
CUDA C编程权威指南:1-基于CUDA的异构并行计算
摘要:什么是CUDA?CUDA(Compute Unified Device Architecture,统一计算设备架构)是NVIDIA(英伟达)提出的并行计算架构,结合了CPU和GPU的优点,主要用来处理密集型及并行计算。什么是异构计算?这里的异构主要指的是主机端的CPU和设备端的GPU,CPU更擅长逻 阅读全文
posted @ 2023-10-05 01:26 扫地升 阅读(200) 评论(0) 推荐(0) 编辑

< 2025年2月 >
26 27 28 29 30 31 1
2 3 4 5 6 7 8
9 10 11 12 13 14 15
16 17 18 19 20 21 22
23 24 25 26 27 28 1
2 3 4 5 6 7 8

点击右上角即可分享
微信分享提示