摘要: CUDA编程学习 (2)——CUDA并行性模型 这篇文章深入探讨了CUDA编程中的并行性模型,重点介绍了基于kernel的单指令多数据(SPMD)编程。首先,通过向量加法示例,展示了CUDA内核函数的编写与调用,并解释了__global__、__device__和__host__的不同用法。接着,文章扩展到多维网格配置,演示如何处理图像数据,如RGB转灰度和图像模糊。最后,讨论了线程调度及其透明扩展性,强调了warp执行和GPU资源管理。 阅读全文
posted @ 2024-10-26 11:46 Astron_fjh 阅读(22) 评论(0) 推荐(0) 编辑
摘要: CUDA编程学习 (1)——CUDA C介绍 这篇文章是关于CUDA编程的基础介绍,主要聚焦于CUDA C的概念与内存管理。文章首先阐明了CUDA的异构计算模型,区分了CPU(host)和GPU(device)的角色,并介绍了它们之间的数据移动和通信机制。接着,详细说明了CUDA程序的执行流程,包括内存分配、数据传输和核函数的调用。 阅读全文
posted @ 2024-10-26 11:44 Astron_fjh 阅读(22) 评论(0) 推荐(0) 编辑