CUDA C编程,GPU编程,GPU优化计算
CUDA C编程,GPU编程,GPU优化计算
CUDA编程套路格式
根据《GPU编程与优化》的学习有:
1.获取配置GPU设备
1 cudaSetDevice(0); //获取GPU设备,如果只有一个默认为0,这个时候可以缺省,其他情况这不行。
2.分配GPU显存大小
1 cudaMalloc((void**) &d_a, sizeof(float) *n); //分配显存
3.Host2Device数据传输
1 cudaMemcpy(d_a,a,sizeof(float) *n,cudaMemcpyHostToDevice); //数据传输,主机到设备
4.调用kernel function
1 gpu_kernel<<<blocks,threads>>>(***); //kernel function调用
5.Device2Host数据传输
1 cudaMemcpy(a,d_a,sizeof(float) *n, cudaMemcpyDeviceToHost); 2 //D2H数据传输,GPU结果返回CPU
6.释放显存
1 cudaFree(d_a) //释放显存空间,每个变量是一个显存空间,所以每个变量都要释放
7.释放设备
1 cudaDeviceReset(); //重置设备,可以省略