随笔分类 - 异构计算
摘要:CUDA C语言对C语言的扩展主要包含以下几个方面。1.函数限定符 __device__:声明在设备上执行的函数。该函数无法被CPU端调用,只能由GPU端程序调用,即只能被__device__或__global__声明的函数调用。__global__:声明的函数称为kernel函数。该函数只能被CP
阅读全文
摘要:时至今日,GPU并行程序开发已经得到全面发展,形成了有机的软件生态系统。构成GPU软件生态系统的成分包括编译器、编程模型、数学函数库、性能分析工具、程序调试工具、代码实例(SDK)、管理软件、应用软件和完整的文档等。 编译器主要有NVIDIA CUDA Compiler(NVCC)、PGI CUDA
阅读全文